GIẢI PHÁP CHUẨN HÓA CÁC KHO NGỮ LIỆU DÙNG TRONG LĨNH VỰC DỊCH TỰ ĐỘNG

Hiện nay, nhu cấu sử dụng và khai thác dữ liệu để xây dựng các hệ thống dịch tự động là rất lớn. Tuy nhiên, chi phí cho việc thu thập và xây dựng một kho ngữ liệu mới để có thể dùng được đối với hệ thống dịch tự động là rất cao. Trong khi đó, các kho ngữ liệu đang có trên thực tế lại có cấu trúc và...

Deskribapen osoa

Gorde:
Xehetasun bibliografikoak
Egile Nagusiak: Đặng, Đại Thọ, Huỳnh, Công Pháp
Formatua: Artikulua
Hizkuntza:Vietnamese
Argitaratua: 2018
Sarrera elektronikoa:http://thuvien.cit.udn.vn//handle/123456789/23
Etiketak: Etiketa erantsi
Etiketarik gabe, Izan zaitez lehena erregistro honi etiketa jartzen!
Thư viện lưu trữ: Trường Đại học Công nghệ Thông tin và Truyền thông Việt Hàn - Đại học Đà Nẵng
Deskribapena
Gaia:Hiện nay, nhu cấu sử dụng và khai thác dữ liệu để xây dựng các hệ thống dịch tự động là rất lớn. Tuy nhiên, chi phí cho việc thu thập và xây dựng một kho ngữ liệu mới để có thể dùng được đối với hệ thống dịch tự động là rất cao. Trong khi đó, các kho ngữ liệu đang có trên thực tế lại có cấu trúc và định dạng khác nhau nên việc chia sẽ và khai thác chúng gặp rất nhiều khó khăn. Trong bài báo này, chúng tôi đề xuất một cấu trúc và định dạng chuẩn cho phép biểu diễn và lưu trữ các kho ngữ liệu dùng trong lĩnh vực dịch tự động, để từ đó cho phép việc khai thác, chia sẻ và sử dụng các kho ngữ liệu này một cách thuận tiện và hiệu quả.