Khai thác song song tập phổ biến trên cơ sở dữ liệu phân tán dọc

Trong bài báo này, chúng tôi phát triển phương pháp để khai thác tập phổ biến trên CSDL được phân tán dọc. Cách tiếp cận khai thác song song của chúng tôi như sau: Đầu tiên, từng Slave sẽ khai thác cục bộ các tập phổ biến từ các item mà Slave đó chứa và gửi về Master. Master chỉ khai thác các tập p...

Mô tả đầy đủ

Đã lưu trong:
Chi tiết về thư mục
Những tác giả chính: Võ, Đình Bảy, Cao, Tùng Anh, Lê, Hoài Bắc
Ngôn ngữ:Vietnamese
Được phát hành: Trường Đại học Đà Lạt 2011
Những chủ đề:
Truy cập trực tuyến:https://scholar.dlu.edu.vn/thuvienso/handle/DLU123456789/3559
Các nhãn: Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
Thư viện lưu trữ: Thư viện Trường Đại học Đà Lạt
Miêu tả
Tóm tắt:Trong bài báo này, chúng tôi phát triển phương pháp để khai thác tập phổ biến trên CSDL được phân tán dọc. Cách tiếp cận khai thác song song của chúng tôi như sau: Đầu tiên, từng Slave sẽ khai thác cục bộ các tập phổ biến từ các item mà Slave đó chứa và gửi về Master. Master chỉ khai thác các tập phổ biến chứa các item từ ít nhất hai Slave trở lên. Phương pháp này làm giảm đáng kể thời gian so với việc tập trung dữ liệu lại trên Master để khai thác. Tính hiệu quả đạt được ở chỗ nó khai thác song song các tập phổ biến ở từng Slave. Các item từ các Slave chỉ được tập hợp tại Master để khai thác khi độ phổ biến (support) của nó thỏa ngưỡng độ phổ biến tối thiểu (minSup). Vì vậy, phương pháp này chỉ cần quét các CSDL cục bộ (trên từng Slave) một lần.