Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc

Bài báo khoa học; từ trang 211-218

Zapisane w:
Opis bibliograficzny
Główni autorzy: Nguyễn, Tấn Phú, Nguyễn, Nhị Gia Vinh, Lê, Thị Diễm, Lê, Minh Lý
Format: Bài viết
Język:Vietnamese
Wydane: Nhà xuất bản Đà Nẵng 2021
Hasła przedmiotowe:
Dostęp online:http://elib.vku.udn.vn/handle/123456789/763
Etykiety: Dodaj etykietę
Nie ma etykietki, Dołącz pierwszą etykiete!
Thư viện lưu trữ: Trường Đại học Công nghệ Thông tin và Truyền thông Việt Hàn - Đại học Đà Nẵng
id oai:elib.vku.udn.vn:123456789-763
record_format dspace
spelling oai:elib.vku.udn.vn:123456789-7632021-02-22T01:15:24Z Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc A Convolutional Neural Network Model to Separate Singing Voice from Music Nguyễn, Tấn Phú Nguyễn, Nhị Gia Vinh Lê, Thị Diễm Lê, Minh Lý Mạng nơron tích chập (Convolutional Neural Network) Phép biến đổi Fourier thời gian ngắn (Short time Fourier Transform) Đặc trưng âm thanh (audio feature) Demixing Secrets Dataset 100 (DSD100) Bài báo khoa học; từ trang 211-218 Nghiên cứu này đề xuất một mô hình phân tách giọng hát từ nguồn hỗn hợp âm nhạc bằng mạng nơron tích chập - CNN (Convolutional Neural Network). Phép biến đổi Fourier thời gian ngắn - STFT (Short time Fourier Transform) được áp dụng để trích các đặc trưng cơ bản của tín hiệu giọng hát. Bộ dữ liệu DSD100 (Demixing Secrets Dataset 100) gồm các hỗn hợp âm nhạc của giọng hát và nhạc đệm từ các nhạc cụ như trống, bass, .v.v. được sử dụng để đánh giá hiệu suất của mô hình mạng CNN. Kết quả thực nghiệm cho thấy mô hình mạng CNN đạt độ chính xác là 97.24%. 2021-02-22T01:15:12Z 2021-02-22T01:15:12Z 2020 Working Paper 978-604-84-5517-0 http://elib.vku.udn.vn/handle/123456789/763 vi application/pdf Nhà xuất bản Đà Nẵng
institution Trường Đại học Công nghệ Thông tin và Truyền thông Việt Hàn - Đại học Đà Nẵng
collection DSpace
language Vietnamese
topic Mạng nơron tích chập (Convolutional Neural Network)
Phép biến đổi Fourier thời gian ngắn (Short time Fourier Transform)
Đặc trưng âm thanh (audio feature)
Demixing Secrets Dataset 100 (DSD100)
spellingShingle Mạng nơron tích chập (Convolutional Neural Network)
Phép biến đổi Fourier thời gian ngắn (Short time Fourier Transform)
Đặc trưng âm thanh (audio feature)
Demixing Secrets Dataset 100 (DSD100)
Nguyễn, Tấn Phú
Nguyễn, Nhị Gia Vinh
Lê, Thị Diễm
Lê, Minh Lý
Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc
description Bài báo khoa học; từ trang 211-218
format Working Paper
author Nguyễn, Tấn Phú
Nguyễn, Nhị Gia Vinh
Lê, Thị Diễm
Lê, Minh Lý
author_facet Nguyễn, Tấn Phú
Nguyễn, Nhị Gia Vinh
Lê, Thị Diễm
Lê, Minh Lý
author_sort Nguyễn, Tấn Phú
title Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc
title_short Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc
title_full Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc
title_fullStr Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc
title_full_unstemmed Mô hình mạng Nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc
title_sort mô hình mạng nơron tích chập phân tách giọng hát từ hỗn hợp âm nhạc
publisher Nhà xuất bản Đà Nẵng
publishDate 2021
url http://elib.vku.udn.vn/handle/123456789/763
_version_ 1849198886027001856