Phân tích giọng hát từ hỗn hợp âm nhạc : Luận văn thạc sĩ công nghệ thông tin chuyên ngành. Hệ thống Thông tin
Trong luận văn này, xây dựng một hệ thống phân tách giọng hát từ hỗn hợp âm nhạc bằng mô hình mạng nerual tích chập (CNN) của kỹ thuật học sâu (deep learning). Đồng thời, kết hợp mặt nạ nhị phân vào quá trình phân tách giọng hát. Việc kế...
Đã lưu trong:
Tác giả chính: | |
---|---|
Định dạng: | Sách |
Ngôn ngữ: | Undetermined |
Được phát hành: |
Cần Thơ
Trường Đại học Cần Thơ
2019
|
Những chủ đề: | |
Các nhãn: |
Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
|
Thư viện lưu trữ: | Trung tâm Học liệu Trường Đại học Cần Thơ |
---|
Tóm tắt: | Trong luận văn này, xây dựng một hệ thống phân tách giọng hát từ hỗn hợp âm nhạc bằng mô hình mạng nerual tích chập (CNN) của kỹ thuật học sâu (deep learning). Đồng thời, kết hợp mặt nạ nhị phân vào quá trình phân tách giọng hát. Việc kết hợp mặt nạ nhị phân vào quá trình phân tách để ước lượng mặt nạ tần số thời gian được áp dụng cho tách nguồn. Bộ dữ liệu Demixing Secrets Dataset 100 (DSD100) [8] được sử dụng để đánh giá. Kết quả thực nghiệm cho thấy mô hình CNN kiểm thử đạt độ chính xác là 97.24%. Hiệu suất của hệ thống tương đương với các thuật toán tiên tiến khác như nhân tố ma trận không âm về mặt phân tích hiệu suất. Luận văn này là một bước tiến để nghiên cứu sâu hơn trong lĩnh vực này, đặc biệt là thực hiện các thuật toán tách nguồn cho các mục đích y tế như căng cường lời nói cho cấy ốc tai điện tử, một nhiệm vụ đòi hỏi độ trễ thấp. Từ khóa: Mặt nạ nhị phân, mạng nerual tích chập, học sâu, độ trễ thấp. |
---|