Xử lí dữ liệu không cân bằng : tiếp cận rút gọn kích thước dữ liệu : Luận văn Thạc sĩ Công nghệ thông tin chuyên ngành Hệ thống thông tin

Trong khai mỏ dữ liệu, lớp không cân bằng là vấn đề quan trọng trong thiết kế phân lớp.Sự không cần bằng của dữ liệu ảnh hưởng nghiêm trọng đến phân loại dữ liệu.Nhưng nhiếu ứng dụng thực tế có liên quan đến dữ liệu không cân bằ...

ver descrição completa

Na minha lista:
Detalhes bibliográficos
Autor principal: Phạm, Xuân Hiền
Formato: Livro
Idioma:Undetermined
Publicado em: Cần Thơ Trường Đại học Cần Thơ 2010
Assuntos:
Tags: Adicionar Tag
Sem tags, seja o primeiro a adicionar uma tag!
Thư viện lưu trữ: Trung tâm Học liệu Trường Đại học Cần Thơ
Descrição
Resumo:Trong khai mỏ dữ liệu, lớp không cân bằng là vấn đề quan trọng trong thiết kế phân lớp.Sự không cần bằng của dữ liệu ảnh hưởng nghiêm trọng đến phân loại dữ liệu.Nhưng nhiếu ứng dụng thực tế có liên quan đến dữ liệu không cân bằng mà các gảii thuật học thường không quan tâm đến vấn đề này . Trong các giải thuật học thường không quan tâm đến ácc dữ liệu không cân bằng , lớp lớn lấn áp lớp nhỏ ,giải thuật thường bỏ qua lớp nhỏ .Đối với vấn đề này ,lấy mẫu rút gọn là phương pháp phổ biến , lấy mẫu chỉ một tập con của lớp lớn . Nhược điểm của phương pháp lấy mẫu rút gọn là bỏ qua một số thông tin hữu ích. Vì vậy để gảii quyết vấn đề này , tiếp cận lấy mẫu rút gọc mới được đề xuất : phương pháp lấy mẫu đơn giản (EasyEnsemble) và phương pháp lấy mẫu cân bằng (balancecacade).