Phân tích giọng hát từ hỗn hợp âm nhạc : Luận văn thạc sĩ công nghệ thông tin chuyên ngành. Hệ thống Thông tin

Trong luận văn này, xây dựng một hệ thống phân tách giọng hát từ hỗn hợp âm nhạc bằng mô hình mạng nerual tích chập (CNN) của kỹ thuật học sâu (deep learning). Đồng thời, kết hợp mặt nạ nhị phân vào quá trình phân tách giọng hát. Việc kế...

Mô tả đầy đủ

Đã lưu trong:
Chi tiết về thư mục
Tác giả chính: Nguyễn, Tấn Phú
Định dạng: Sách
Ngôn ngữ:Undetermined
Được phát hành: Cần Thơ Trường Đại học Cần Thơ 2019
Những chủ đề:
Các nhãn: Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
Thư viện lưu trữ: Trung tâm Học liệu Trường Đại học Cần Thơ
Miêu tả
Tóm tắt:Trong luận văn này, xây dựng một hệ thống phân tách giọng hát từ hỗn hợp âm nhạc bằng mô hình mạng nerual tích chập (CNN) của kỹ thuật học sâu (deep learning). Đồng thời, kết hợp mặt nạ nhị phân vào quá trình phân tách giọng hát. Việc kết hợp mặt nạ nhị phân vào quá trình phân tách để ước lượng mặt nạ tần số thời gian được áp dụng cho tách nguồn. Bộ dữ liệu Demixing Secrets Dataset 100 (DSD100) [8] được sử dụng để đánh giá. Kết quả thực nghiệm cho thấy mô hình CNN kiểm thử đạt độ chính xác là 97.24%. Hiệu suất của hệ thống tương đương với các thuật toán tiên tiến khác như nhân tố ma trận không âm về mặt phân tích hiệu suất. Luận văn này là một bước tiến để nghiên cứu sâu hơn trong lĩnh vực này, đặc biệt là thực hiện các thuật toán tách nguồn cho các mục đích y tế như căng cường lời nói cho cấy ốc tai điện tử, một nhiệm vụ đòi hỏi độ trễ thấp. Từ khóa: Mặt nạ nhị phân, mạng nerual tích chập, học sâu, độ trễ thấp.