AUDIO SCENE CLASSIFICATION USING GATED RECURRENT NEURAL NETWORK

Phân loại bối cảnh âm thanh đã nhận được sự chú ý trong nhiều năm qua. Đó là sự nhận dạng môi trường xung quanh với sự hỗ trợ của âm thanh nền. Nghiên cứu này để xuất ba hệ thống cho việc phân loại dựa trên Gated Recurrent Neural Network. Một hệ thống gồm hai phần chính là trích xuất đặc trưng và ph...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Đặng, Thị Thúy An, Trần, Thị Kiều
Formato: Artículo
Lenguaje:Vietnamese
Publicado: 2018
Materias:
GRU
Acceso en línea:http://thuvien.cit.udn.vn//handle/123456789/101
Etiquetas: Agregar Etiqueta
Sin Etiquetas, Sea el primero en etiquetar este registro!
Thư viện lưu trữ: Trường Đại học Công nghệ Thông tin và Truyền thông Việt Hàn - Đại học Đà Nẵng
Descripción
Sumario:Phân loại bối cảnh âm thanh đã nhận được sự chú ý trong nhiều năm qua. Đó là sự nhận dạng môi trường xung quanh với sự hỗ trợ của âm thanh nền. Nghiên cứu này để xuất ba hệ thống cho việc phân loại dựa trên Gated Recurrent Neural Network. Một hệ thống gồm hai phần chính là trích xuất đặc trưng và phân loại. Đối với trích xuất đặc trưng, chúng tôi sử dụng thuật toán MFCC, những đặc trưng này sẽ là dữ liệu vào của quá trình phân loại sau đó. Đối với quá trình phân loại, chúng tôi sử dụng phương pháp Gated Recurrent Neural Network bao gồm hai thuật toán chính là Long short term memory và Gated recurrent unit. Chúng tôi thử nghiệm các hệ thống đề xuất trên tập dữ liệu LITIS Rouen bao gồm 19 danh mục và có độ dài 1500 phút. Tỷ lệ phân loại cao nhất dựa trên hệ thống đề xuất của chúng tôi là 94.92%. Đây là một tỷ lệ khá cao trong phân loại bối cảnh âm thanh và cao hơn 3.0% khi so sánh với bài báo gốc