Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn

Rừng ngẫu nhiên do Breiman đề xuất là một giải thuật tập hợp mô hình có độ chính xác rất cao. Tuy nhiên, nhược điểm chính của giải thuật là quá trình huấn luyện và phân lớp phải mất nhiều thời gian. Do đó việc nghiên cứu cải thiện thời gian thực hiện của giải thuật là cần thiết để có thể khai thác h...

Mô tả đầy đủ

Đã lưu trong:
Chi tiết về thư mục
Những tác giả chính: Đỗ, Thanh Nghị, Phạm, Nguyên Khang
Định dạng: Bài viết
Ngôn ngữ:Vietnamese
Được phát hành: Trường Đại học Đà Lạt 2012
Những chủ đề:
Truy cập trực tuyến:https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/33630
Các nhãn: Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
Thư viện lưu trữ: Thư viện Trường Đại học Đà Lạt
id oai:scholar.dlu.edu.vn:DLU123456789-33630
record_format dspace
spelling oai:scholar.dlu.edu.vn:DLU123456789-336302012-12-26T01:04:14Z Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn Đỗ, Thanh Nghị Phạm, Nguyên Khang Rừng ngẫu nhiên Cây quyết định Bagging Boosting Rừng ngẫu nhiên do Breiman đề xuất là một giải thuật tập hợp mô hình có độ chính xác rất cao. Tuy nhiên, nhược điểm chính của giải thuật là quá trình huấn luyện và phân lớp phải mất nhiều thời gian. Do đó việc nghiên cứu cải thiện thời gian thực hiện của giải thuật là cần thiết để có thể khai thác hiệu quả các tập dữ liệu khổng lồ. Trong bài viết, chúng tôi đề xuất giải thuật song song rừng ngẫu nhiên trên Grid cho phép giảm thời gian huấn luyện và phân lớp. Kết quả thực nghiệm trên các tập dữ liệu lớn như Forest cover type, KDD cup 1999, Connect-4 từ kho dữ liệu UCI cho thấy rằng thời gian huấn luyện và phân lớp của giải thuật song song giảm mạnh. 2012-12-26T01:04:14Z 2012-12-26T01:04:14Z 2012 Working Paper https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/33630 vi Kỷ yếu Hội thảo công nghệ thông tin 2012;tr. 26-36 application/pdf Trường Đại học Đà Lạt
institution Thư viện Trường Đại học Đà Lạt
collection Thư viện số
language Vietnamese
topic Rừng ngẫu nhiên
Cây quyết định
Bagging
Boosting
spellingShingle Rừng ngẫu nhiên
Cây quyết định
Bagging
Boosting
Đỗ, Thanh Nghị
Phạm, Nguyên Khang
Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn
description Rừng ngẫu nhiên do Breiman đề xuất là một giải thuật tập hợp mô hình có độ chính xác rất cao. Tuy nhiên, nhược điểm chính của giải thuật là quá trình huấn luyện và phân lớp phải mất nhiều thời gian. Do đó việc nghiên cứu cải thiện thời gian thực hiện của giải thuật là cần thiết để có thể khai thác hiệu quả các tập dữ liệu khổng lồ. Trong bài viết, chúng tôi đề xuất giải thuật song song rừng ngẫu nhiên trên Grid cho phép giảm thời gian huấn luyện và phân lớp. Kết quả thực nghiệm trên các tập dữ liệu lớn như Forest cover type, KDD cup 1999, Connect-4 từ kho dữ liệu UCI cho thấy rằng thời gian huấn luyện và phân lớp của giải thuật song song giảm mạnh.
format Working Paper
author Đỗ, Thanh Nghị
Phạm, Nguyên Khang
author_facet Đỗ, Thanh Nghị
Phạm, Nguyên Khang
author_sort Đỗ, Thanh Nghị
title Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn
title_short Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn
title_full Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn
title_fullStr Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn
title_full_unstemmed Giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn
title_sort giải thuật song song rừng ngẫu nhiên cho phân lớp dữ liệu lớn
publisher Trường Đại học Đà Lạt
publishDate 2012
url https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/33630
_version_ 1819772656178692096