Phân nhóm văn bản tiếng Việt với Ghsom : Luận văn Thạc sĩ Công nghệ thông tin. Chuyên ngành Hệ thống thông tin
Nội dung đề tài nghiên cứu văn bản tiếng Việt trong tập dữ liệu sẽ được biểu diễn bởi một vec-tơ chỉ mục trong không gian các từ khóa chỉ mục. Sử dụng thư viện vnTokenizer để tách từ tiếng Việt, sau đó áp dụng giải thuật GHSOM trên ma t...
محفوظ في:
| المؤلف الرئيسي: | |
|---|---|
| التنسيق: | كتاب |
| اللغة: | Undetermined |
| منشور في: |
Cần Thơ
Trường Đại học Cần Thơ
2013
|
| الموضوعات: | |
| الوسوم: |
إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
|
| Thư viện lưu trữ: | Trung tâm Học liệu Trường Đại học Cần Thơ |
|---|
| الملخص: | Nội dung đề tài nghiên cứu văn bản tiếng Việt trong tập dữ liệu sẽ được biểu diễn bởi một vec-tơ chỉ mục trong không gian các từ khóa chỉ mục. Sử dụng thư viện vnTokenizer để tách từ tiếng Việt, sau đó áp dụng giải thuật GHSOM trên ma trận tài liệu - từ chỉ mục để xây dựng cấu trúc cây phân cấp theo chủ đề. Chương trình phân nhóm được viết bằng ngôn ngữ Java trên nền NetBeans 7.1.2. |
|---|