Xây dựng công cụ tóm tắt văn bản tiếng việt tự động

Trong bài báo này chúng tôi đề xuất mô hình tóm tắt văn bản tiếng Việt tự động. Văn bản được biểu diễn bằng đồ thị: đỉnh biểu diễn một câu trong văn bản; các cạnh nối biểu diễn sự tương tự về ngữ nghĩa giữa hai đỉnh (câu). Trọng số của cạnh là giá trị tương tự của hai câu được tính bởi 1 trong 3 phư...

Mô tả đầy đủ

Đã lưu trong:
Chi tiết về thư mục
Những tác giả chính: Nguyễn, Quang Dũng, Trương, Quốc Định
Định dạng: Bài viết
Ngôn ngữ:Vietnamese
Được phát hành: Trường Đại học Đà Lạt 2012
Những chủ đề:
Truy cập trực tuyến:https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/33644
Các nhãn: Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
Thư viện lưu trữ: Thư viện Trường Đại học Đà Lạt
id oai:scholar.dlu.edu.vn:DLU123456789-33644
record_format dspace
spelling oai:scholar.dlu.edu.vn:DLU123456789-336442012-12-26T02:49:52Z Xây dựng công cụ tóm tắt văn bản tiếng việt tự động Nguyễn, Quang Dũng Trương, Quốc Định Công nghệ thông tin Tóm tắt văn bản Trong bài báo này chúng tôi đề xuất mô hình tóm tắt văn bản tiếng Việt tự động. Văn bản được biểu diễn bằng đồ thị: đỉnh biểu diễn một câu trong văn bản; các cạnh nối biểu diễn sự tương tự về ngữ nghĩa giữa hai đỉnh (câu). Trọng số của cạnh là giá trị tương tự của hai câu được tính bởi 1 trong 3 phương pháp Jaro, Contrast Model và Jaccard. Độ quan trọng của đỉnh (câu) được tính bởi thuật toán PageRank. Để kiểm chứng tính chính xác của mô hình đề xuất, chúng tôi so sánh kết quả tóm tắt tự động với kết quả tóm tắt của chuyên gia vì thế dữ liệu thực nghiệm sử dụng là khá khiêm tốn (gồm 5 văn bản thuộc các chủ đề khác nhau). Kết quả tóm tắt của hệ thống có độ tin cậy cao vì được đánh giá bởi tập dữ liệu đánh giá được tổng hợp từ 12 nhà khoa học uy tín. Kết quả cho thấy việc kết hợp thuật toán xếp hạng PageRank với các phép đo Contrast và Jaccard cho kết quả tóm tắt tốt nhất (51.5 và 52%). 2012-12-26T02:49:52Z 2012-12-26T02:49:52Z 2012 Working Paper https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/33644 vi Kỷ yếu Hội thảo công nghệ thông tin 2012;tr. 173-181 application/pdf Trường Đại học Đà Lạt
institution Thư viện Trường Đại học Đà Lạt
collection Thư viện số
language Vietnamese
topic Công nghệ thông tin
Tóm tắt văn bản
spellingShingle Công nghệ thông tin
Tóm tắt văn bản
Nguyễn, Quang Dũng
Trương, Quốc Định
Xây dựng công cụ tóm tắt văn bản tiếng việt tự động
description Trong bài báo này chúng tôi đề xuất mô hình tóm tắt văn bản tiếng Việt tự động. Văn bản được biểu diễn bằng đồ thị: đỉnh biểu diễn một câu trong văn bản; các cạnh nối biểu diễn sự tương tự về ngữ nghĩa giữa hai đỉnh (câu). Trọng số của cạnh là giá trị tương tự của hai câu được tính bởi 1 trong 3 phương pháp Jaro, Contrast Model và Jaccard. Độ quan trọng của đỉnh (câu) được tính bởi thuật toán PageRank. Để kiểm chứng tính chính xác của mô hình đề xuất, chúng tôi so sánh kết quả tóm tắt tự động với kết quả tóm tắt của chuyên gia vì thế dữ liệu thực nghiệm sử dụng là khá khiêm tốn (gồm 5 văn bản thuộc các chủ đề khác nhau). Kết quả tóm tắt của hệ thống có độ tin cậy cao vì được đánh giá bởi tập dữ liệu đánh giá được tổng hợp từ 12 nhà khoa học uy tín. Kết quả cho thấy việc kết hợp thuật toán xếp hạng PageRank với các phép đo Contrast và Jaccard cho kết quả tóm tắt tốt nhất (51.5 và 52%).
format Working Paper
author Nguyễn, Quang Dũng
Trương, Quốc Định
author_facet Nguyễn, Quang Dũng
Trương, Quốc Định
author_sort Nguyễn, Quang Dũng
title Xây dựng công cụ tóm tắt văn bản tiếng việt tự động
title_short Xây dựng công cụ tóm tắt văn bản tiếng việt tự động
title_full Xây dựng công cụ tóm tắt văn bản tiếng việt tự động
title_fullStr Xây dựng công cụ tóm tắt văn bản tiếng việt tự động
title_full_unstemmed Xây dựng công cụ tóm tắt văn bản tiếng việt tự động
title_sort xây dựng công cụ tóm tắt văn bản tiếng việt tự động
publisher Trường Đại học Đà Lạt
publishDate 2012
url https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/33644
_version_ 1819768537742311424