Xử lí dữ liệu không cân bằng : tiếp cận rút gọn kích thước dữ liệu : Luận văn Thạc sĩ Công nghệ thông tin chuyên ngành Hệ thống thông tin
Trong khai mỏ dữ liệu, lớp không cân bằng là vấn đề quan trọng trong thiết kế phân lớp.Sự không cần bằng của dữ liệu ảnh hưởng nghiêm trọng đến phân loại dữ liệu.Nhưng nhiếu ứng dụng thực tế có liên quan đến dữ liệu không cân bằ...
Đã lưu trong:
Tác giả chính: | |
---|---|
Định dạng: | Sách |
Ngôn ngữ: | Undetermined |
Được phát hành: |
Cần Thơ
Trường Đại học Cần Thơ
2010
|
Những chủ đề: | |
Các nhãn: |
Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
|
Thư viện lưu trữ: | Trung tâm Học liệu Trường Đại học Cần Thơ |
---|
Tóm tắt: | Trong khai mỏ dữ liệu, lớp không cân bằng là vấn đề quan trọng trong thiết kế phân lớp.Sự không cần bằng của dữ liệu ảnh hưởng nghiêm trọng đến phân loại dữ liệu.Nhưng nhiếu ứng dụng thực tế có liên quan đến dữ liệu không cân bằng mà các gảii thuật học thường không quan tâm đến vấn đề này . Trong các giải thuật học thường không quan tâm đến ácc dữ liệu không cân bằng , lớp lớn lấn áp lớp nhỏ ,giải thuật thường bỏ qua lớp nhỏ .Đối với vấn đề này ,lấy mẫu rút gọn là phương pháp phổ biến , lấy mẫu chỉ một tập con của lớp lớn . Nhược điểm của phương pháp lấy mẫu rút gọn là bỏ qua một số thông tin hữu ích. Vì vậy để gảii quyết vấn đề này , tiếp cận lấy mẫu rút gọc mới được đề xuất : phương pháp lấy mẫu đơn giản (EasyEnsemble) và phương pháp lấy mẫu cân bằng (balancecacade). |
---|