Xây dựng Mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị

Nhận dạng tiếng nói dùng mô hình Markov ẩn (HMM) đã được ứng dụng rộng rãi trong các hệ thống giao tiếp người-máy bằng giọng nói. Nghiên cứu này mô tả các bước đầu tiên trong việc xây dựng một mô-đun điều khiển máy tính bằng giọng nói nhằm trợ giúp người khiếm thị điều khiển ứng dụng đọc báo điện tử...

Celý popis

Uloženo v:
Podrobná bibliografie
Hlavní autoři: Lê, Vũ Công Hòa, Hoàng, Thị Minh Khanh, Lê, Quang Tam, Ninh, Khánh Duy
Médium: Článek
Jazyk:Vietnamese
Vydáno: 2018
Témata:
On-line přístup:http://thuvien.cit.udn.vn//handle/123456789/240
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo otaguje tento záznam!
Thư viện lưu trữ: Trường Đại học Công nghệ Thông tin và Truyền thông Việt Hàn - Đại học Đà Nẵng
id oai:elib.vku.udn.vn:123456789-240
record_format dspace
spelling oai:elib.vku.udn.vn:123456789-2402021-02-18T03:27:38Z Xây dựng Mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị Lê, Vũ Công Hòa Hoàng, Thị Minh Khanh Lê, Quang Tam Ninh, Khánh Duy Điều khiển bằng giọng nói Nhận dạng tiếng nói rời rạc Mô hình Markov ẩn Đọc báo cho người khiếm thị Nhận dạng tiếng nói dùng mô hình Markov ẩn (HMM) đã được ứng dụng rộng rãi trong các hệ thống giao tiếp người-máy bằng giọng nói. Nghiên cứu này mô tả các bước đầu tiên trong việc xây dựng một mô-đun điều khiển máy tính bằng giọng nói nhằm trợ giúp người khiếm thị điều khiển ứng dụng đọc báo điện tử. Để tạo ra hệ thống dễ sử dụng cho người khiếm thị, chúng tôi đã thiết kế tập lệnh điều khiển gồm 4 nhóm với 46 lệnh là các từ đơn. Để huấn luyện và kiểm thử hệ thống nhận dạng tiếng nói, chúng tôi đã thu âm dữ liệu tiếng nói của 42 người với các chất giọng khác nhau trong điều kiện môi trường thực tế và tiến hành các thử nghiệm nhận dạng. Thực nghiệm cho thấy việc thiết lập các tham số của HMM và kích thước dữ liệu huấn luyện ảnh hưởng không nhỏ đến kết quả nhận dạng. Ở chế độ offline, hệ thống nhận dạng tiếng nói rời rạc của chúng tôi đạt độ chính xác cao nhất lần lượt là 99,42% và 91,14% trong các thử nghiệm nhận dạng phụ thuộc người nói và độc lập người nói. Ở chế độ online, hệ thống đạt độ chính xác trên 80% khi nhận dạng độc lập người nói trong điều kiện phòng tương đối yên tĩnh và phần cứng máy tính có tài nguyên hạn chế 2018-12-08T03:02:16Z 2018-12-08T03:02:16Z 2017 Article http://thuvien.cit.udn.vn//handle/123456789/240 vi application/pdf
institution Trường Đại học Công nghệ Thông tin và Truyền thông Việt Hàn - Đại học Đà Nẵng
collection DSpace
language Vietnamese
topic Điều khiển bằng giọng nói
Nhận dạng tiếng nói rời rạc
Mô hình Markov ẩn
Đọc báo cho người khiếm thị
spellingShingle Điều khiển bằng giọng nói
Nhận dạng tiếng nói rời rạc
Mô hình Markov ẩn
Đọc báo cho người khiếm thị
Lê, Vũ Công Hòa
Hoàng, Thị Minh Khanh
Lê, Quang Tam
Ninh, Khánh Duy
Xây dựng Mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị
description Nhận dạng tiếng nói dùng mô hình Markov ẩn (HMM) đã được ứng dụng rộng rãi trong các hệ thống giao tiếp người-máy bằng giọng nói. Nghiên cứu này mô tả các bước đầu tiên trong việc xây dựng một mô-đun điều khiển máy tính bằng giọng nói nhằm trợ giúp người khiếm thị điều khiển ứng dụng đọc báo điện tử. Để tạo ra hệ thống dễ sử dụng cho người khiếm thị, chúng tôi đã thiết kế tập lệnh điều khiển gồm 4 nhóm với 46 lệnh là các từ đơn. Để huấn luyện và kiểm thử hệ thống nhận dạng tiếng nói, chúng tôi đã thu âm dữ liệu tiếng nói của 42 người với các chất giọng khác nhau trong điều kiện môi trường thực tế và tiến hành các thử nghiệm nhận dạng. Thực nghiệm cho thấy việc thiết lập các tham số của HMM và kích thước dữ liệu huấn luyện ảnh hưởng không nhỏ đến kết quả nhận dạng. Ở chế độ offline, hệ thống nhận dạng tiếng nói rời rạc của chúng tôi đạt độ chính xác cao nhất lần lượt là 99,42% và 91,14% trong các thử nghiệm nhận dạng phụ thuộc người nói và độc lập người nói. Ở chế độ online, hệ thống đạt độ chính xác trên 80% khi nhận dạng độc lập người nói trong điều kiện phòng tương đối yên tĩnh và phần cứng máy tính có tài nguyên hạn chế
format Article
author Lê, Vũ Công Hòa
Hoàng, Thị Minh Khanh
Lê, Quang Tam
Ninh, Khánh Duy
author_facet Lê, Vũ Công Hòa
Hoàng, Thị Minh Khanh
Lê, Quang Tam
Ninh, Khánh Duy
author_sort Lê, Vũ Công Hòa
title Xây dựng Mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị
title_short Xây dựng Mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị
title_full Xây dựng Mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị
title_fullStr Xây dựng Mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị
title_full_unstemmed Xây dựng Mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị
title_sort xây dựng mô-đun điều khiển bằng giọng nói trong ứng dụng đọc báo điện tử cho người khiếm thị
publishDate 2018
url http://thuvien.cit.udn.vn//handle/123456789/240
_version_ 1849203595129389056