MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT

In natural language processing, part-of-speech (POS) tagging plays an important role, as its output is the input of many other tasks (syntax analysis, semantic analysis. . . ). One of the problems related to POS tagging is to define the POS set. This could be solved using unsupervised machine learni...

Mô tả đầy đủ

Đã lưu trong:
Chi tiết về thư mục
Những tác giả chính: Nguyễn, Minh Hiệp, Nguyễn, Thị Minh Huyền, Ngô, Thế Quyền, Trần, Thị Phương Linh
Định dạng: Bài viết
Ngôn ngữ:Vietnamese
Được phát hành: Trường Đại học Đà Lạt 2023
Truy cập trực tuyến:https://tckh.dlu.edu.vn/index.php/tckhdhdl/article/view/40
https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/114208
Các nhãn: Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
Thư viện lưu trữ: Thư viện Trường Đại học Đà Lạt
id oai:scholar.dlu.edu.vn:DLU123456789-114208
record_format dspace
spelling oai:scholar.dlu.edu.vn:DLU123456789-1142082023-10-27T14:43:25Z MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT Nguyễn, Minh Hiệp Nguyễn, Thị Minh Huyền Ngô, Thế Quyền Trần, Thị Phương Linh In natural language processing, part-of-speech (POS) tagging plays an important role, as its output is the input of many other tasks (syntax analysis, semantic analysis. . . ). One of the problems related to POS tagging is to define the POS set. This could be solved using unsupervised machine learning methods. This paper presents an application of the DBSCAN clustering algorithm to classify Vietnamese words from a large corpus. The features used to characterize each word are naturally defined by the context of that word in a sentence. We use a large corpus containing sentences automatically extracted from the online Nhan Dan newspaper. 2023-03-04T08:23:00Z 2023-03-04T08:23:00Z 2016 Article 0866-787X https://tckh.dlu.edu.vn/index.php/tckhdhdl/article/view/40 https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/114208 10.37569/DalatUniversity.6.2.40(2016) vi Tạp chí Khoa học Đại học Đà Lạt, Tập 6, Số 2; tr. application/pdf Trường Đại học Đà Lạt
institution Thư viện Trường Đại học Đà Lạt
collection Thư viện số
language Vietnamese
description In natural language processing, part-of-speech (POS) tagging plays an important role, as its output is the input of many other tasks (syntax analysis, semantic analysis. . . ). One of the problems related to POS tagging is to define the POS set. This could be solved using unsupervised machine learning methods. This paper presents an application of the DBSCAN clustering algorithm to classify Vietnamese words from a large corpus. The features used to characterize each word are naturally defined by the context of that word in a sentence. We use a large corpus containing sentences automatically extracted from the online Nhan Dan newspaper.
format Article
author Nguyễn, Minh Hiệp
Nguyễn, Thị Minh Huyền
Ngô, Thế Quyền
Trần, Thị Phương Linh
spellingShingle Nguyễn, Minh Hiệp
Nguyễn, Thị Minh Huyền
Ngô, Thế Quyền
Trần, Thị Phương Linh
MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT
author_facet Nguyễn, Minh Hiệp
Nguyễn, Thị Minh Huyền
Ngô, Thế Quyền
Trần, Thị Phương Linh
author_sort Nguyễn, Minh Hiệp
title MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT
title_short MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT
title_full MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT
title_fullStr MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT
title_full_unstemmed MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT
title_sort một kỹ thuật phân cụm cho từ loại tiếng việt
publisher Trường Đại học Đà Lạt
publishDate 2023
url https://tckh.dlu.edu.vn/index.php/tckhdhdl/article/view/40
https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/114208
_version_ 1781718654286561280