RỜI RẠC HÓA DỮ LIỆU DỰA VÀO TÍNH HẠT CỦA TẬP THÔ

Phương pháp tập thô do Pawlak (1982) đề xuất là một trong những công cụ hiệu quả trong việc khai thác và trích rút thông tin từ dữ liệu. Trong các hệ hỗ trợ quyết định, thuật toán LEM2 của hệ LERS (Learning from Examples based on Rough Sets) do Grzymala- Busse (1992) đề xuất cũng như một số thuật to...

Mô tả đầy đủ

Đã lưu trong:
Chi tiết về thư mục
Tác giả chính: Huỳnh, Bảo Tuyên
Tác giả khác: Tạ, Thị Thu Phượng
Định dạng: Research report
Ngôn ngữ:Vietnamese
Được phát hành: 2023
Những chủ đề:
Truy cập trực tuyến:https://scholar.dlu.edu.vn/handle/123456789/2333
Các nhãn: Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
Thư viện lưu trữ: Thư viện Trường Đại học Đà Lạt
Miêu tả
Tóm tắt:Phương pháp tập thô do Pawlak (1982) đề xuất là một trong những công cụ hiệu quả trong việc khai thác và trích rút thông tin từ dữ liệu. Trong các hệ hỗ trợ quyết định, thuật toán LEM2 của hệ LERS (Learning from Examples based on Rough Sets) do Grzymala- Busse (1992) đề xuất cũng như một số thuật toán khác dựa trên ý tưởng của lý thuyết tập thô là một công cụ hữu ích để giải quyết bài toán rút trích các luật quyết định của một hệ. Tuy nhiên, một trong những điểm quan trọng khi áp dụng các phương pháp này là phải đảm bảo các thuộc tính điều kiện của một bảng quyết định ở dạng rời rạc. Điều này dẫn đến yêu cầu rời rạc hóa đối với các thuộc tính điều kiện nhận giá trị thực của một bảng quyết định. Có nhiều cách tiếp cận cho bài toán rời rạc hóa dữ liệu, chẳng hạn tiếp cận bằng các phương pháp thống kê như Li Zuo và cộng sự (2013), các nghiên cứu của N.H. Son và A. Skowron (1995) dựa trên logic mệnh đề, hoặc các đề xuất của M.R. Chmielewski và J.W. Grzymala-Busse (1996). Trong đó, đáng chú ý là thuật toán dựa trên biểu diễn logic mệnh đề được đề xuất bởi N.H. Son và A. Skowron còn được gọi là thuật toán MD-heuristics. Thuật toán MD-heuristics này cho kết quả là một phương án rời rạc có thể không tối giản. Điều này sẽ ảnh hưởng đến việc giảm thiểu số chiều của các thuộc tính điều kiện, chất lượng của tập luật quyết định khi áp dụng các thuật toán như LEM2 vào bảng quyết định đã được rời rạc hóa,… Đề tài này nhằm tìm hiểu phương pháp rời rạc hóa dữ liệu dựa trên thuật toán MD-heuristics do N.H. Sơn và A. Skowron đề xuất. Tuy nhiên, chúng tôi mở rộng vấn đề trên cho việc kiểm tra tính dư thừa trong một phương án rời rạc hóa dữ liệu.