Hệ thống lập chỉ mục và tìm kiếm videos : Luận văn Thạc sĩ Công nghệ thông tin. Chuyên ngành Khoa học máy tính
Trong những năm gần đây, dữ liệu kỹ thuật số bùng nổ về chủng loại cũng như dung lượng do quá trình số hóa đang diễn ra nhanh chóng tại các tổ chức, tập đoàn cũng như cá nhân. Tuy nhiên, năng lực xử lý, lập chỉ mục và tìm kiếm dữ liệ...
Đã lưu trong:
Tác giả chính: | |
---|---|
Định dạng: | Sách |
Ngôn ngữ: | Undetermined |
Được phát hành: |
Cần Thơ
Trường Đại học Cần Thơ
2020
|
Những chủ đề: | |
Các nhãn: |
Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
|
Thư viện lưu trữ: | Trung tâm Học liệu Trường Đại học Cần Thơ |
---|
Tóm tắt: | Trong những năm gần đây, dữ liệu kỹ thuật số bùng nổ về chủng loại cũng như dung lượng do quá trình số hóa đang diễn ra nhanh chóng tại các tổ chức, tập đoàn cũng như cá nhân. Tuy nhiên, năng lực xử lý, lập chỉ mục và tìm kiếm dữ liệu kỹ thuật số không phát triển tương ứng. Trên thực tế, với lượng dữ liệu video rất lớn cả ngoại tuyến và trực tuyến, nhu cầu lập chỉ mục và truy xuất nội dung video trở nên cấp thiết hơn bao giờ hết, đặc biệt là đối với các nhà sản xuất và phát sóng nội dung video. Trong luận văn này, chúng tôi nghiên cứu về hệ thống lập chỉ mục và truy vấn video, tập trung vào hiệu quả lập chỉ mục và độ chính xác của việc truy vấn với hy vọng đáp ứng được yêu cầu của người dùng ở mức độ cao. Mục tiêu của đề tài là xây dựng một hệ thống tìm kiếm video cho phép người dùng truy vấn video dựa trên truy vấn có thể là hình ảnh (được trích xuất thành các đặc trưng SIFT, COLOR, HOG, GIST hoặc DEEP) hoặc văn bản (được trích xuất thành đặc trưng TF-IDF) hoặc cả hai. Với câu truy vấn kết hợp giữa hình ảnh và văn bản, hệ thống sử dụng phương pháp kết hợp muộn để kết hợp độ tương đồng văn bản và hình ảnh, sau đó trả về danh sách video có độ tương đồng tích hợp cao nhất. Hệ thống lập chỉ mục và tìm kiếm video được đánh giá dựa trên tập dữ liệu video được trích xuất từ kho dữ liệu tin tức của Đài Truyền hình Kiên Giang. Kết quả thử nghiệm tốt nhất đạt độ chính xác mAP là 79,32% ở Top-5 bằng truy vấn kết hợp giữa hình ảnh và văn bản. |
---|