Xây dựng Mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị

Nhận dạng tiếng nói dùng mô hình Markov ẩn (HMM) đã được ứng dụng rộng rãi trong các hệ thống giao tiếp người-máy bằng giọng nói. Nghiên cứu này mô tả các bước đầu tiên trong việc xây dựng một mô-đun điều khiển máy tính bằng giọng nói nhằm trợ giúp người khiếm thị điều khiển ứng dụng đọc báo điện tử...

Volledige beschrijving

Bewaard in:
Bibliografische gegevens
Hoofdauteurs: Lê, Vũ Công Hòa, Hoàng, Thị Minh Khanh, Lê, Quang Tam, Ninh, Khánh Duy
Formaat: Artikel
Taal:Vietnamese
Gepubliceerd in: 2018
Onderwerpen:
Online toegang:http://thuvien.cit.udn.vn//handle/123456789/240
Tags: Voeg label toe
Geen labels, Wees de eerste die dit record labelt!
Thư viện lưu trữ: Trường Đại học Công nghệ Thông tin và Truyền thông Việt Hàn - Đại học Đà Nẵng
Omschrijving
Samenvatting:Nhận dạng tiếng nói dùng mô hình Markov ẩn (HMM) đã được ứng dụng rộng rãi trong các hệ thống giao tiếp người-máy bằng giọng nói. Nghiên cứu này mô tả các bước đầu tiên trong việc xây dựng một mô-đun điều khiển máy tính bằng giọng nói nhằm trợ giúp người khiếm thị điều khiển ứng dụng đọc báo điện tử. Để tạo ra hệ thống dễ sử dụng cho người khiếm thị, chúng tôi đã thiết kế tập lệnh điều khiển gồm 4 nhóm với 46 lệnh là các từ đơn. Để huấn luyện và kiểm thử hệ thống nhận dạng tiếng nói, chúng tôi đã thu âm dữ liệu tiếng nói của 42 người với các chất giọng khác nhau trong điều kiện môi trường thực tế và tiến hành các thử nghiệm nhận dạng. Thực nghiệm cho thấy việc thiết lập các tham số của HMM và kích thước dữ liệu huấn luyện ảnh hưởng không nhỏ đến kết quả nhận dạng. Ở chế độ offline, hệ thống nhận dạng tiếng nói rời rạc của chúng tôi đạt độ chính xác cao nhất lần lượt là 99,42% và 91,14% trong các thử nghiệm nhận dạng phụ thuộc người nói và độc lập người nói. Ở chế độ online, hệ thống đạt độ chính xác trên 80% khi nhận dạng độc lập người nói trong điều kiện phòng tương đối yên tĩnh và phần cứng máy tính có tài nguyên hạn chế