Phân nhóm văn bản tiếng Việt với Ghsom : Luận văn Thạc sĩ Công nghệ thông tin. Chuyên ngành Hệ thống thông tin

Nội dung đề tài nghiên cứu văn bản tiếng Việt trong tập dữ liệu sẽ được biểu diễn bởi một vec-tơ chỉ mục trong không gian các từ khóa chỉ mục. Sử dụng thư viện vnTokenizer để tách từ tiếng Việt, sau đó áp dụng giải thuật GHSOM trên ma t...

Full description

Saved in:
Bibliographic Details
Main Author: Nguyễn, Hữu Phon
Format: Book
Language:Undetermined
Published: Cần Thơ Trường Đại học Cần Thơ 2013
Subjects:
Tags: Add Tag
No Tags, Be the first to tag this record!
Institutions: Trung tâm Học liệu Trường Đại học Cần Thơ
Description
Summary:Nội dung đề tài nghiên cứu văn bản tiếng Việt trong tập dữ liệu sẽ được biểu diễn bởi một vec-tơ chỉ mục trong không gian các từ khóa chỉ mục. Sử dụng thư viện vnTokenizer để tách từ tiếng Việt, sau đó áp dụng giải thuật GHSOM trên ma trận tài liệu - từ chỉ mục để xây dựng cấu trúc cây phân cấp theo chủ đề. Chương trình phân nhóm được viết bằng ngôn ngữ Java trên nền NetBeans 7.1.2.