RỜI RẠC HÓA DỮ LIỆU DỰA VÀO TÍNH HẠT CỦA TẬP THÔ

Phương pháp tập thô do Pawlak (1982) đề xuất là một trong những công cụ hiệu quả trong việc khai thác và trích rút thông tin từ dữ liệu. Trong các hệ hỗ trợ quyết định, thuật toán LEM2 của hệ LERS (Learning from Examples based on Rough Sets) do Grzymala- Busse (1992) đề xuất cũng như một số thuật to...

Mô tả đầy đủ

Đã lưu trong:
Chi tiết về thư mục
Tác giả chính: Huỳnh, Bảo Tuyên
Tác giả khác: Tạ, Thị Thu Phượng
Định dạng: Research report
Ngôn ngữ:Vietnamese
Được phát hành: 2023
Những chủ đề:
Truy cập trực tuyến:https://scholar.dlu.edu.vn/handle/123456789/2333
Các nhãn: Thêm thẻ
Không có thẻ, Là người đầu tiên thẻ bản ghi này!
Thư viện lưu trữ: Thư viện Trường Đại học Đà Lạt
id oai:scholar.dlu.edu.vn:123456789-2333
record_format dspace
spelling oai:scholar.dlu.edu.vn:123456789-23332023-06-14T04:19:16Z RỜI RẠC HÓA DỮ LIỆU DỰA VÀO TÍNH HẠT CỦA TẬP THÔ Huỳnh, Bảo Tuyên Tạ, Thị Thu Phượng Lý thuyết Tập thô luật quyết định rời rạc hóa dữ liệu Phương pháp tập thô do Pawlak (1982) đề xuất là một trong những công cụ hiệu quả trong việc khai thác và trích rút thông tin từ dữ liệu. Trong các hệ hỗ trợ quyết định, thuật toán LEM2 của hệ LERS (Learning from Examples based on Rough Sets) do Grzymala- Busse (1992) đề xuất cũng như một số thuật toán khác dựa trên ý tưởng của lý thuyết tập thô là một công cụ hữu ích để giải quyết bài toán rút trích các luật quyết định của một hệ. Tuy nhiên, một trong những điểm quan trọng khi áp dụng các phương pháp này là phải đảm bảo các thuộc tính điều kiện của một bảng quyết định ở dạng rời rạc. Điều này dẫn đến yêu cầu rời rạc hóa đối với các thuộc tính điều kiện nhận giá trị thực của một bảng quyết định. Có nhiều cách tiếp cận cho bài toán rời rạc hóa dữ liệu, chẳng hạn tiếp cận bằng các phương pháp thống kê như Li Zuo và cộng sự (2013), các nghiên cứu của N.H. Son và A. Skowron (1995) dựa trên logic mệnh đề, hoặc các đề xuất của M.R. Chmielewski và J.W. Grzymala-Busse (1996). Trong đó, đáng chú ý là thuật toán dựa trên biểu diễn logic mệnh đề được đề xuất bởi N.H. Son và A. Skowron còn được gọi là thuật toán MD-heuristics. Thuật toán MD-heuristics này cho kết quả là một phương án rời rạc có thể không tối giản. Điều này sẽ ảnh hưởng đến việc giảm thiểu số chiều của các thuộc tính điều kiện, chất lượng của tập luật quyết định khi áp dụng các thuật toán như LEM2 vào bảng quyết định đã được rời rạc hóa,… Đề tài này nhằm tìm hiểu phương pháp rời rạc hóa dữ liệu dựa trên thuật toán MD-heuristics do N.H. Sơn và A. Skowron đề xuất. Tuy nhiên, chúng tôi mở rộng vấn đề trên cho việc kiểm tra tính dư thừa trong một phương án rời rạc hóa dữ liệu. 2023-05-19T09:30:02Z 2023-05-19T09:30:02Z 2016 2015 2016 Research report Đề tài cấp Trường Khoa học tự nhiên https://scholar.dlu.edu.vn/handle/123456789/2333 vi [1] Chmielewski, M.R. & Grzymala-Busse J.W. (1996). Global Discretization of Continuous Attributes as Preprocessing for Machine Learning, Int. Journal of Approximate Reasoning (15), 319–331. [2] Grzymala-Busse J.W. (1992). LERS – a system for learning from examples based on rough sets. In R. Slowinski (ed.), Intelligent Decision Support (pp. 3-18). Kluwer Academic Publishers. [3] Huy D. P. (2012). Note on LEM2- Based Decision Rules Induction. Proceedings of the Workshop on Information Technology, Dalat University, 111-124. [4] Leung Y., Fischer M. M., Wu W. -Z. & Mi J. -S, (2008). An rough set approach for the discovery of classification rules in interval-valued information systems, International Journal of Approximate Reasoning, 47, 233 - 246. [5] Pawlak Z. (1991). Rough Sets- Theoretical Aspects of Reasoning about Data. Kluwer Academic Publishers. [6] Pawlak Z. & Skowron A. (2007). Rough Sets and Boolean Reasoning, Information sciences, 177, 41 - 73. [7] Son N. H. & Skowron A. (1995). Quantization of real value attributes, in: Proceedings of the Second Joint Annual Conference on Information Sciences, Wrightsville Beach, NC, USA, 34–37. [8] Tuyen H. B., Phuong T. T. T. & Huy D. P. (2011). Model of rough set: Approximations and related measures. Proceedings of First Workshop on Information Technology and Mathematical Applications, University of Nhatrang, Nhatrang, 282 – 292. [9] Zou L. & et al. (2013). An Algorithm for Discretization of Real Value Attributes Based on Interval Similarity, Journal of Applied Mathematics, Hindawi Publishing Corporation.
institution Thư viện Trường Đại học Đà Lạt
collection Thư viện số
language Vietnamese
topic Lý thuyết Tập thô
luật quyết định
rời rạc hóa dữ liệu
spellingShingle Lý thuyết Tập thô
luật quyết định
rời rạc hóa dữ liệu
Huỳnh, Bảo Tuyên
RỜI RẠC HÓA DỮ LIỆU DỰA VÀO TÍNH HẠT CỦA TẬP THÔ
description Phương pháp tập thô do Pawlak (1982) đề xuất là một trong những công cụ hiệu quả trong việc khai thác và trích rút thông tin từ dữ liệu. Trong các hệ hỗ trợ quyết định, thuật toán LEM2 của hệ LERS (Learning from Examples based on Rough Sets) do Grzymala- Busse (1992) đề xuất cũng như một số thuật toán khác dựa trên ý tưởng của lý thuyết tập thô là một công cụ hữu ích để giải quyết bài toán rút trích các luật quyết định của một hệ. Tuy nhiên, một trong những điểm quan trọng khi áp dụng các phương pháp này là phải đảm bảo các thuộc tính điều kiện của một bảng quyết định ở dạng rời rạc. Điều này dẫn đến yêu cầu rời rạc hóa đối với các thuộc tính điều kiện nhận giá trị thực của một bảng quyết định. Có nhiều cách tiếp cận cho bài toán rời rạc hóa dữ liệu, chẳng hạn tiếp cận bằng các phương pháp thống kê như Li Zuo và cộng sự (2013), các nghiên cứu của N.H. Son và A. Skowron (1995) dựa trên logic mệnh đề, hoặc các đề xuất của M.R. Chmielewski và J.W. Grzymala-Busse (1996). Trong đó, đáng chú ý là thuật toán dựa trên biểu diễn logic mệnh đề được đề xuất bởi N.H. Son và A. Skowron còn được gọi là thuật toán MD-heuristics. Thuật toán MD-heuristics này cho kết quả là một phương án rời rạc có thể không tối giản. Điều này sẽ ảnh hưởng đến việc giảm thiểu số chiều của các thuộc tính điều kiện, chất lượng của tập luật quyết định khi áp dụng các thuật toán như LEM2 vào bảng quyết định đã được rời rạc hóa,… Đề tài này nhằm tìm hiểu phương pháp rời rạc hóa dữ liệu dựa trên thuật toán MD-heuristics do N.H. Sơn và A. Skowron đề xuất. Tuy nhiên, chúng tôi mở rộng vấn đề trên cho việc kiểm tra tính dư thừa trong một phương án rời rạc hóa dữ liệu.
author2 Tạ, Thị Thu Phượng
author_facet Tạ, Thị Thu Phượng
Huỳnh, Bảo Tuyên
format Research report
author Huỳnh, Bảo Tuyên
author_sort Huỳnh, Bảo Tuyên
title RỜI RẠC HÓA DỮ LIỆU DỰA VÀO TÍNH HẠT CỦA TẬP THÔ
title_short RỜI RẠC HÓA DỮ LIỆU DỰA VÀO TÍNH HẠT CỦA TẬP THÔ
title_full RỜI RẠC HÓA DỮ LIỆU DỰA VÀO TÍNH HẠT CỦA TẬP THÔ
title_fullStr RỜI RẠC HÓA DỮ LIỆU DỰA VÀO TÍNH HẠT CỦA TẬP THÔ
title_full_unstemmed RỜI RẠC HÓA DỮ LIỆU DỰA VÀO TÍNH HẠT CỦA TẬP THÔ
title_sort rời rạc hóa dữ liệu dựa vào tính hạt của tập thô
publishDate 2023
url https://scholar.dlu.edu.vn/handle/123456789/2333
_version_ 1778233853013393408