Phân nhóm văn bản tiếng Việt với Ghsom : Luận văn Thạc sĩ Công nghệ thông tin. Chuyên ngành Hệ thống thông tin

Nội dung đề tài nghiên cứu văn bản tiếng Việt trong tập dữ liệu sẽ được biểu diễn bởi một vec-tơ chỉ mục trong không gian các từ khóa chỉ mục. Sử dụng thư viện vnTokenizer để tách từ tiếng Việt, sau đó áp dụng giải thuật GHSOM trên ma t...

Szczegółowa specyfikacja

Zapisane w:
Opis bibliograficzny
1. autor: Nguyễn, Hữu Phon
Format: Książka
Język:Undetermined
Wydane: Cần Thơ Trường Đại học Cần Thơ 2013
Hasła przedmiotowe:
Etykiety: Dodaj etykietę
Nie ma etykietki, Dołącz pierwszą etykiete!
Thư viện lưu trữ: Trung tâm Học liệu Trường Đại học Cần Thơ
Opis
Streszczenie:Nội dung đề tài nghiên cứu văn bản tiếng Việt trong tập dữ liệu sẽ được biểu diễn bởi một vec-tơ chỉ mục trong không gian các từ khóa chỉ mục. Sử dụng thư viện vnTokenizer để tách từ tiếng Việt, sau đó áp dụng giải thuật GHSOM trên ma trận tài liệu - từ chỉ mục để xây dựng cấu trúc cây phân cấp theo chủ đề. Chương trình phân nhóm được viết bằng ngôn ngữ Java trên nền NetBeans 7.1.2.