GIẢI PHÁP CHUẨN HÓA CÁC KHO NGỮ LIỆU DÙNG TRONG LĨNH VỰC DỊCH TỰ ĐỘNG

Hiện nay, nhu cấu sử dụng và khai thác dữ liệu để xây dựng các hệ thống dịch tự động là rất lớn. Tuy nhiên, chi phí cho việc thu thập và xây dựng một kho ngữ liệu mới để có thể dùng được đối với hệ thống dịch tự động là rất cao. Trong khi đó, các kho ngữ liệu đang có trên thực tế lại có cấu trúc và...

Volledige beschrijving

Bewaard in:
Bibliografische gegevens
Hoofdauteurs: Đặng, Đại Thọ, Huỳnh, Công Pháp
Formaat: Artikel
Taal:Vietnamese
Gepubliceerd in: 2018
Online toegang:http://thuvien.cit.udn.vn//handle/123456789/23
Tags: Voeg label toe
Geen labels, Wees de eerste die dit record labelt!
Thư viện lưu trữ: Trường Đại học Công nghệ Thông tin và Truyền thông Việt Hàn - Đại học Đà Nẵng
Omschrijving
Samenvatting:Hiện nay, nhu cấu sử dụng và khai thác dữ liệu để xây dựng các hệ thống dịch tự động là rất lớn. Tuy nhiên, chi phí cho việc thu thập và xây dựng một kho ngữ liệu mới để có thể dùng được đối với hệ thống dịch tự động là rất cao. Trong khi đó, các kho ngữ liệu đang có trên thực tế lại có cấu trúc và định dạng khác nhau nên việc chia sẽ và khai thác chúng gặp rất nhiều khó khăn. Trong bài báo này, chúng tôi đề xuất một cấu trúc và định dạng chuẩn cho phép biểu diễn và lưu trữ các kho ngữ liệu dùng trong lĩnh vực dịch tự động, để từ đó cho phép việc khai thác, chia sẻ và sử dụng các kho ngữ liệu này một cách thuận tiện và hiệu quả.