Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn
Rừng ngẫu nhiên do Breiman đề xuất là một giải thuật tập hợp mô hình có độ chính xác rất cao. Tuy nhiên, nhược điểm chính của giải thuật là quá trình huấn luyện và phân lớp phải mất nhiều thời gian. Do đó việc nghiên cứu cải thiện thời gian thực hiện của giải thuật là cần thiết để có thể khai thác h...
Đã lưu trong:
Những tác giả chính: | , |
---|---|
Định dạng: | Bài viết |
Ngôn ngữ: | Vietnamese |
Được phát hành: |
Trường Đại học Đà Lạt
2012
|
Những chủ đề: | |
Truy cập trực tuyến: | https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/33630 |
Các nhãn: |
Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
|
Thư viện lưu trữ: | Thư viện Trường Đại học Đà Lạt |
---|
Tóm tắt: | Rừng ngẫu nhiên do Breiman đề xuất là một giải thuật tập hợp mô hình có độ chính xác rất cao. Tuy nhiên, nhược điểm chính của giải thuật là quá trình huấn luyện và phân lớp phải mất nhiều thời gian. Do đó việc nghiên cứu cải thiện thời gian thực hiện của giải thuật là cần thiết để có thể khai thác hiệu quả các tập dữ liệu khổng lồ. Trong bài viết, chúng tôi đề xuất giải thuật song song rừng ngẫu nhiên trên Grid cho phép giảm thời gian huấn luyện và phân lớp. Kết quả thực nghiệm trên các tập dữ liệu lớn như Forest cover type, KDD cup 1999, Connect-4 từ kho dữ liệu UCI cho thấy rằng thời gian huấn luyện và phân lớp của giải thuật song song giảm mạnh. |
---|