Tăng tốc tìm kiếm tài nguyên học tập theo nội dung bằng kỹ thuật xử lý dữ liệu lớn

Bài báo khoa học; từ trang 171-178

Αποθηκεύτηκε σε:
Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριοι συγγραφείς: Trần, Thanh Điện, Nguyễn, Ngọc Tuấn, Nguyễn, Thanh Hải, Nguyễn, Thái Nghe
Μορφή: Bài viết
Γλώσσα:Vietnamese
Έκδοση: Nhà xuất bản Đà Nẵng 2021
Θέματα:
Διαθέσιμο Online:http://elib.vku.udn.vn/handle/123456789/758
Ετικέτες: Προσθήκη ετικέτας
Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!
Thư viện lưu trữ: Trường Đại học Công nghệ Thông tin và Truyền thông Việt Hàn - Đại học Đà Nẵng
id oai:elib.vku.udn.vn:123456789-758
record_format dspace
spelling oai:elib.vku.udn.vn:123456789-7582021-02-18T09:57:40Z Tăng tốc tìm kiếm tài nguyên học tập theo nội dung bằng kỹ thuật xử lý dữ liệu lớn Trần, Thanh Điện Nguyễn, Ngọc Tuấn Nguyễn, Thanh Hải Nguyễn, Thái Nghe tài nguyên học tập tìm kiếm dựa trên nội dung dữ liệu lớn Hadoop Mapreduce độ tương đồng Bài báo khoa học; từ trang 171-178 Học tập trực tuyến là một giải pháp khá hữu hiệu trong môi trường giáo dục đào tạo. Tuy nhiên người học còn gặp nhiều khó khăn trong tìm kiếm tài nguyên học tập do tên các tài nguyên khi được lưu trữ chưa phản ánh được từ khóa người dùng mong đợi. Vì vậy, làm cách nào để tìm chính xác các từ khóa trong nội dung tài nguyên học tập thay vì tìm kiếm thông thường từ các meta-data là rất cần thiết để hỗ trợ người học tiết kiệm thời gian, công sức. Hiện có nhiều nghiên cứu về tìm kiếm tài nguyên học tập theo nội dung đã cho kết quả khá chính xác, tuy nhiên khi khối lượng tài nguyên ngày càng tăng thì việc tìm kiếm vận hành khá chậm. Bài viết này đề xuất giải pháp nhằm tăng tốc tìm kiếm tài nguyên học tập theo nội dung dựa trên các kỹ thuật xử lý dữ liệu lớn. Cụ thể, các kỹ thuật xử lý văn bản được sử dụng trên nền tảng Hadoop như tách từ tiếng Việt, loại bỏ từ dừng, tính trọng số TF-IDF (Term Frequency-Inverse Document Frequency), biểu diễn văn bản thành dạng không gian vectơ, tính độ tương đồng cosine để đo mức độ tương tự của các từ khóa trong tài liệu nhằm trả về tài liệu có độ tương đồng cao nhất. Thực nghiệm trên một số tài liệu tiếng Việt cho thấy việc xử lý song song rút ngắn thời gian tìm kiếm hơn rất nhiều so với tìm kiếm truyền thống trong khi độ chính xác không thay đổi. 2021-02-18T09:57:28Z 2021-02-18T09:57:28Z 2020 Working Paper 978-604-84-5517-0 http://elib.vku.udn.vn/handle/123456789/758 vi application/pdf Nhà xuất bản Đà Nẵng
institution Trường Đại học Công nghệ Thông tin và Truyền thông Việt Hàn - Đại học Đà Nẵng
collection DSpace
language Vietnamese
topic tài nguyên học tập
tìm kiếm dựa trên nội dung
dữ liệu lớn
Hadoop Mapreduce
độ tương đồng
spellingShingle tài nguyên học tập
tìm kiếm dựa trên nội dung
dữ liệu lớn
Hadoop Mapreduce
độ tương đồng
Trần, Thanh Điện
Nguyễn, Ngọc Tuấn
Nguyễn, Thanh Hải
Nguyễn, Thái Nghe
Tăng tốc tìm kiếm tài nguyên học tập theo nội dung bằng kỹ thuật xử lý dữ liệu lớn
description Bài báo khoa học; từ trang 171-178
format Working Paper
author Trần, Thanh Điện
Nguyễn, Ngọc Tuấn
Nguyễn, Thanh Hải
Nguyễn, Thái Nghe
author_facet Trần, Thanh Điện
Nguyễn, Ngọc Tuấn
Nguyễn, Thanh Hải
Nguyễn, Thái Nghe
author_sort Trần, Thanh Điện
title Tăng tốc tìm kiếm tài nguyên học tập theo nội dung bằng kỹ thuật xử lý dữ liệu lớn
title_short Tăng tốc tìm kiếm tài nguyên học tập theo nội dung bằng kỹ thuật xử lý dữ liệu lớn
title_full Tăng tốc tìm kiếm tài nguyên học tập theo nội dung bằng kỹ thuật xử lý dữ liệu lớn
title_fullStr Tăng tốc tìm kiếm tài nguyên học tập theo nội dung bằng kỹ thuật xử lý dữ liệu lớn
title_full_unstemmed Tăng tốc tìm kiếm tài nguyên học tập theo nội dung bằng kỹ thuật xử lý dữ liệu lớn
title_sort tăng tốc tìm kiếm tài nguyên học tập theo nội dung bằng kỹ thuật xử lý dữ liệu lớn
publisher Nhà xuất bản Đà Nẵng
publishDate 2021
url http://elib.vku.udn.vn/handle/123456789/758
_version_ 1849204301015023616