Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn

Rừng ngẫu nhiên do Breiman đề xuất là một giải thuật tập hợp mô hình có độ chính xác rất cao. Tuy nhiên, nhược điểm chính của giải thuật là quá trình huấn luyện và phân lớp phải mất nhiều thời gian. Do đó việc nghiên cứu cải thiện thời gian thực hiện của giải thuật là cần thiết để có thể khai thác h...

Mô tả đầy đủ

Đã lưu trong:
Chi tiết về thư mục
Những tác giả chính: Đỗ, Thanh Nghị, Phạm, Nguyên Khang
Định dạng: Bài viết
Ngôn ngữ:Vietnamese
Được phát hành: Trường Đại học Đà Lạt 2012
Những chủ đề:
Truy cập trực tuyến:https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/33630
Các nhãn: Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
Thư viện lưu trữ: Thư viện Trường Đại học Đà Lạt
Miêu tả
Tóm tắt:Rừng ngẫu nhiên do Breiman đề xuất là một giải thuật tập hợp mô hình có độ chính xác rất cao. Tuy nhiên, nhược điểm chính của giải thuật là quá trình huấn luyện và phân lớp phải mất nhiều thời gian. Do đó việc nghiên cứu cải thiện thời gian thực hiện của giải thuật là cần thiết để có thể khai thác hiệu quả các tập dữ liệu khổng lồ. Trong bài viết, chúng tôi đề xuất giải thuật song song rừng ngẫu nhiên trên Grid cho phép giảm thời gian huấn luyện và phân lớp. Kết quả thực nghiệm trên các tập dữ liệu lớn như Forest cover type, KDD cup 1999, Connect-4 từ kho dữ liệu UCI cho thấy rằng thời gian huấn luyện và phân lớp của giải thuật song song giảm mạnh.