Phân nhóm văn bản tiếng Việt với Ghsom : Luận văn Thạc sĩ Công nghệ thông tin. Chuyên ngành Hệ thống thông tin

Nội dung đề tài nghiên cứu văn bản tiếng Việt trong tập dữ liệu sẽ được biểu diễn bởi một vec-tơ chỉ mục trong không gian các từ khóa chỉ mục. Sử dụng thư viện vnTokenizer để tách từ tiếng Việt, sau đó áp dụng giải thuật GHSOM trên ma t...

Deskribapen osoa

Gorde:
Xehetasun bibliografikoak
Egile nagusia: Nguyễn, Hữu Phon
Formatua: Liburua
Hizkuntza:Undetermined
Argitaratua: Cần Thơ Trường Đại học Cần Thơ 2013
Gaiak:
Etiketak: Etiketa erantsi
Etiketarik gabe, Izan zaitez lehena erregistro honi etiketa jartzen!
Thư viện lưu trữ: Trung tâm Học liệu Trường Đại học Cần Thơ
Deskribapena
Gaia:Nội dung đề tài nghiên cứu văn bản tiếng Việt trong tập dữ liệu sẽ được biểu diễn bởi một vec-tơ chỉ mục trong không gian các từ khóa chỉ mục. Sử dụng thư viện vnTokenizer để tách từ tiếng Việt, sau đó áp dụng giải thuật GHSOM trên ma trận tài liệu - từ chỉ mục để xây dựng cấu trúc cây phân cấp theo chủ đề. Chương trình phân nhóm được viết bằng ngôn ngữ Java trên nền NetBeans 7.1.2.