Phân nhóm văn bản tiếng Việt với Ghsom : Luận văn Thạc sĩ Công nghệ thông tin. Chuyên ngành Hệ thống thông tin

Nội dung đề tài nghiên cứu văn bản tiếng Việt trong tập dữ liệu sẽ được biểu diễn bởi một vec-tơ chỉ mục trong không gian các từ khóa chỉ mục. Sử dụng thư viện vnTokenizer để tách từ tiếng Việt, sau đó áp dụng giải thuật GHSOM trên ma t...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Nguyễn, Hữu Phon
Format: Buch
Sprache:Undetermined
Veröffentlicht: Cần Thơ Trường Đại học Cần Thơ 2013
Schlagworte:
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Thư viện lưu trữ: Trung tâm Học liệu Trường Đại học Cần Thơ
Beschreibung
Zusammenfassung:Nội dung đề tài nghiên cứu văn bản tiếng Việt trong tập dữ liệu sẽ được biểu diễn bởi một vec-tơ chỉ mục trong không gian các từ khóa chỉ mục. Sử dụng thư viện vnTokenizer để tách từ tiếng Việt, sau đó áp dụng giải thuật GHSOM trên ma trận tài liệu - từ chỉ mục để xây dựng cấu trúc cây phân cấp theo chủ đề. Chương trình phân nhóm được viết bằng ngôn ngữ Java trên nền NetBeans 7.1.2.