MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT
In natural language processing, part-of-speech (POS) tagging plays an important role, as its output is the input of many other tasks (syntax analysis, semantic analysis. . . ). One of the problems related to POS tagging is to define the POS set. This could be solved using unsupervised machine learni...
Đã lưu trong:
Những tác giả chính: | , , , |
---|---|
Định dạng: | Bài viết |
Ngôn ngữ: | Vietnamese |
Được phát hành: |
Trường Đại học Đà Lạt
2023
|
Truy cập trực tuyến: | https://tckh.dlu.edu.vn/index.php/tckhdhdl/article/view/40 https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/114208 |
Các nhãn: |
Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
|
Thư viện lưu trữ: | Thư viện Trường Đại học Đà Lạt |
---|
id |
oai:scholar.dlu.edu.vn:DLU123456789-114208 |
---|---|
record_format |
dspace |
spelling |
oai:scholar.dlu.edu.vn:DLU123456789-1142082023-10-27T14:43:25Z MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT Nguyễn, Minh Hiệp Nguyễn, Thị Minh Huyền Ngô, Thế Quyền Trần, Thị Phương Linh In natural language processing, part-of-speech (POS) tagging plays an important role, as its output is the input of many other tasks (syntax analysis, semantic analysis. . . ). One of the problems related to POS tagging is to define the POS set. This could be solved using unsupervised machine learning methods. This paper presents an application of the DBSCAN clustering algorithm to classify Vietnamese words from a large corpus. The features used to characterize each word are naturally defined by the context of that word in a sentence. We use a large corpus containing sentences automatically extracted from the online Nhan Dan newspaper. 2023-03-04T08:23:00Z 2023-03-04T08:23:00Z 2016 Article 0866-787X https://tckh.dlu.edu.vn/index.php/tckhdhdl/article/view/40 https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/114208 10.37569/DalatUniversity.6.2.40(2016) vi Tạp chí Khoa học Đại học Đà Lạt, Tập 6, Số 2; tr. application/pdf Trường Đại học Đà Lạt |
institution |
Thư viện Trường Đại học Đà Lạt |
collection |
Thư viện số |
language |
Vietnamese |
description |
In natural language processing, part-of-speech (POS) tagging plays an important role, as its output is the input of many other tasks (syntax analysis, semantic analysis. . . ). One of the problems related to POS tagging is to define the POS set. This could be solved using unsupervised machine learning methods. This paper presents an application of the DBSCAN clustering algorithm to classify Vietnamese words from a large corpus. The features used to characterize each word are naturally defined by the context of that word in a sentence. We use a large corpus containing sentences automatically extracted from the online Nhan Dan newspaper. |
format |
Article |
author |
Nguyễn, Minh Hiệp Nguyễn, Thị Minh Huyền Ngô, Thế Quyền Trần, Thị Phương Linh |
spellingShingle |
Nguyễn, Minh Hiệp Nguyễn, Thị Minh Huyền Ngô, Thế Quyền Trần, Thị Phương Linh MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT |
author_facet |
Nguyễn, Minh Hiệp Nguyễn, Thị Minh Huyền Ngô, Thế Quyền Trần, Thị Phương Linh |
author_sort |
Nguyễn, Minh Hiệp |
title |
MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT |
title_short |
MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT |
title_full |
MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT |
title_fullStr |
MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT |
title_full_unstemmed |
MỘT KỸ THUẬT PHÂN CỤM CHO TỪ LOẠI TIẾNG VIỆT |
title_sort |
một kỹ thuật phân cụm cho từ loại tiếng việt |
publisher |
Trường Đại học Đà Lạt |
publishDate |
2023 |
url |
https://tckh.dlu.edu.vn/index.php/tckhdhdl/article/view/40 https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/114208 |
_version_ |
1819770011598716928 |