Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn
Rừng ngẫu nhiên do Breiman đề xuất là một giải thuật tập hợp mô hình có độ chính xác rất cao. Tuy nhiên, nhược điểm chính của giải thuật là quá trình huấn luyện và phân lớp phải mất nhiều thời gian. Do đó việc nghiên cứu cải thiện thời gian thực hiện của giải thuật là cần thiết để có thể khai thác h...
Đã lưu trong:
Những tác giả chính: | , |
---|---|
Định dạng: | Bài viết |
Ngôn ngữ: | Vietnamese |
Được phát hành: |
Trường Đại học Đà Lạt
2012
|
Những chủ đề: | |
Truy cập trực tuyến: | https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/33630 |
Các nhãn: |
Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
|
Thư viện lưu trữ: | Thư viện Trường Đại học Đà Lạt |
---|
id |
oai:scholar.dlu.edu.vn:DLU123456789-33630 |
---|---|
record_format |
dspace |
spelling |
oai:scholar.dlu.edu.vn:DLU123456789-336302012-12-26T01:04:14Z Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn Đỗ, Thanh Nghị Phạm, Nguyên Khang Rừng ngẫu nhiên Cây quyết định Bagging Boosting Rừng ngẫu nhiên do Breiman đề xuất là một giải thuật tập hợp mô hình có độ chính xác rất cao. Tuy nhiên, nhược điểm chính của giải thuật là quá trình huấn luyện và phân lớp phải mất nhiều thời gian. Do đó việc nghiên cứu cải thiện thời gian thực hiện của giải thuật là cần thiết để có thể khai thác hiệu quả các tập dữ liệu khổng lồ. Trong bài viết, chúng tôi đề xuất giải thuật song song rừng ngẫu nhiên trên Grid cho phép giảm thời gian huấn luyện và phân lớp. Kết quả thực nghiệm trên các tập dữ liệu lớn như Forest cover type, KDD cup 1999, Connect-4 từ kho dữ liệu UCI cho thấy rằng thời gian huấn luyện và phân lớp của giải thuật song song giảm mạnh. 2012-12-26T01:04:14Z 2012-12-26T01:04:14Z 2012 Working Paper https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/33630 vi Kỷ yếu Hội thảo công nghệ thông tin 2012;tr. 26-36 application/pdf Trường Đại học Đà Lạt |
institution |
Thư viện Trường Đại học Đà Lạt |
collection |
Thư viện số |
language |
Vietnamese |
topic |
Rừng ngẫu nhiên Cây quyết định Bagging Boosting |
spellingShingle |
Rừng ngẫu nhiên Cây quyết định Bagging Boosting Đỗ, Thanh Nghị Phạm, Nguyên Khang Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn |
description |
Rừng ngẫu nhiên do Breiman đề xuất là một giải thuật tập hợp mô hình có độ chính xác rất cao. Tuy nhiên, nhược điểm chính của giải thuật là quá trình huấn luyện và phân lớp phải mất nhiều thời gian. Do đó việc nghiên cứu cải thiện thời gian thực hiện của giải thuật là cần thiết để có thể khai thác hiệu quả các tập dữ liệu khổng lồ. Trong bài viết, chúng tôi đề xuất giải thuật song song rừng ngẫu nhiên trên Grid cho phép giảm thời gian huấn luyện và phân lớp. Kết quả thực nghiệm trên các tập dữ liệu lớn như Forest cover type, KDD cup 1999, Connect-4 từ kho dữ liệu UCI cho thấy rằng thời gian huấn luyện và phân lớp của giải thuật song song giảm mạnh. |
format |
Working Paper |
author |
Đỗ, Thanh Nghị Phạm, Nguyên Khang |
author_facet |
Đỗ, Thanh Nghị Phạm, Nguyên Khang |
author_sort |
Đỗ, Thanh Nghị |
title |
Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn |
title_short |
Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn |
title_full |
Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn |
title_fullStr |
Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn |
title_full_unstemmed |
Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn |
title_sort |
giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn |
publisher |
Trường Đại học Đà Lạt |
publishDate |
2012 |
url |
https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/33630 |
_version_ |
1819772656178692096 |