Một phương pháp xử lý giá trị ngoại lai trong tập mẫu huấn luyện cây quyết định sử dụng đại số gia tử

  • Lê Văn Tường Lân Đại học Khoa học - Đại học Huế
  • Nguyễn Mậu Hân
  • Nguyễn Công Hào

Abstract

In this paper we propose a method to handle the outliers of the fuzzy fileds in the sample training dataset that based on hedge algebra. Due to the value of the attribute domain may be value or linguistic so we need a method of approximate data in a simple way and effective to handle outliers of it.

Author Biography

Lê Văn Tường Lân, Đại học Khoa học - Đại học Huế

Sinh năm 1974 tại TP. Huế.

Nhận bằng thạc sỹ Tin học, chuyên ngành CNTT tại Trường ĐH Bách khoa Hà Nội, năm 2002. Đang là NCS tại trường ĐH Khoa học – ĐH Huế, chuyên ngành Khoa học Máy tính.

Hiện công tác tại khoa CNTT, Trường ĐH Khoa học, ĐH Huế.

Lĩnh vực nghiên cứu: Khai phá dữ liệu, công nghệ phần mềm.

Điện thoại liên hệ: 0905151357.

References

DƯƠNG THĂNG LONG: Phương pháp xây dựng hệ mờ dạng luật với ngữ nghĩa dựa trên đại số gia tử và ứng dụng trong bài toán phân lớp, Luận án Tiến sĩ Toán học, Viện Công nghệ Thông tin, 2010.

ĐOÀN VĂN BAN, LÊ MẠNH THẠNH, LÊ VĂN TƯỞNG LÂN: Một cách chọn mẫu huấn luyện và thuật toán học để xây dựng cây quyết định trong khai phá dữ liệu, Tạp chí Tin học và Điều khiển học, T23, S4, 2007.

NGUYỄN CÁT HỒ: Lý thuyết tập mờ và Công nghệ tính toán mềm, Tuyển tập các bài giảng về Trường thu hệ mờ và ứng dụng, 2006.

NGUYỄN CÁT HỒ: Cơ sở dữ liệu mờ với ngữ nghĩa đại số gia tử, Bài giảng trường Thu - Hệ mờ và ứng dụng, Viện Toán học Việt Nam, 2008.

NGUYỄN CÔNG HÀO, NGUYỄN CÁT HỒ: Một cách tiếp cận xấp xỉ dữ liệu trong cơ sở dữ liệu mờ, Tạp chí Tin học và Điều khiển học, 2006.

NGUYỄN CÔNG HÀO: Cơ sở dữ liệu mờ với thao tác dữ liệu dựa trên đại số gia tử, Luận án Tiến sĩ Toán học, Viện Công nghệ Thông tin, 2008.

LÊ VĂN TƯỜNG LÂN: Phụ thuộc dữ liệu và tác động của nó đối với bài toán phân lớp của khai phá dữ liệu, Tạp chí khoa học Đại học Huế, Tập:19, Số:53, 2009.

LÊ VĂN TƯỜNG LÂN: Một cách tiếp cận chọn tập mẫu huấn luyện cây quyết định dựa trên đại số gia tử, Hội nghị Quốc gia lần thứ VI về nghiên cứu cơ bản và ứng dụng Công nghệ Thông tin (FAIR), XNB Khoa học tự nhiên và công nghệ, 2013.

PHẠM HẠ THỦY: Xác định phần tử ngoại lai trong cơ sở dữ liệu quan hệ, Tạp chí Tin học và Điều khiển học, T21, S4, 2005.

A.K. BIKAS, E. M. VOUMVOULAKIS AND N. D. HATZIARGYRIOU, Neuro-Fuzzy Decision Trees for Dynamic Security Control of Power Systems, Department of Electrical and Computer Engineering, Greece, 2008.

CHIDA A, Enhanced Encoding with Improved Fuzzy Decision Tree Testing Using CASP Templates, Computational Intelligence Magazine, IEEE, 2012.

CHANG, ROBIN L. P. PAVLIDIS, Fuzzy Decision Tree Algorithms, Man and Cybernetics, IEEE, 2007.

DORIAN P, Data Preparation for Data Mining, Morgan Kaufmann, 1999.

DAVEEDU R. A., JAYA SUMA. G, LAVANYA DEVI G. Construction of Fuzzy Decision Tree using Expectation Maximization Algorithm, International Journal of Computer Science and Management Research, 2012.

E. M. KNORR, Outliers and data mining: finding exceptions in data, Doctor’ thesis, Dept. of Computer science, University of British Columbia, 2002.

FERNANDEZ A., CALDERON M, BARRENECHEA E., Enhancing Fuzzy Rule Based Systems in Multi-Classication Using Pairwise Coupling with Preference Relations, EUROFUSE Workshop Preference Modelling and Decision Analysis, Public University of Navarra, Pamplona, Spain, 2009.

FA. CHAO LI, JUAN SUN, XI-ZHAO WANG, Analysis on the fuzzy filter in fuzzy decision trees, Proceedings of the Second International Conference on Machine Learxung and Cybernetics, 2003.

KAVITA SACHDEVA, MADASU HANMANDLU, AMIOY KUMAR, Real Life Applications of Fuzzy Decision Tree, International Journal of Computer Applications, 2012.

HESHAM A. HEFNY, AHMED S. GHIDUK, ASHRAF ABDEL WAHAB, Effective Method for Extracting Rules from Fuzzy Decision Trees based on Ambiguity and Classifiability, Universal Journal of Computer Science and Engineering Technology, Cairo University, Egypt, 2010.

HO TU BAO, Introduction to knowledge discovery and data mining, Institute of Information Technology National Center for Natural Science, 2000.

HO N. C. AND NAM H. V, An algebraic approach to linguistic hedges in Zadeh's fuzzy logic, Fuzzy Sets and Systems, vol.129, pp.229-254, 2002.

MOUSTAKIDIS, S. MALLINIS, G. KOUTSIAS, N. THEOCHARIS, J.B., PETRIDIS, V, SVM-Based Fuzzy Decision Trees for Classification of High Spatial Resolution Remote Sensing Images, Geoscience and Remote Sensing, IEEE, 2012.

OLEKSANDR DOROKHOV, VLADIMIR CHERNOV, Application of the fuzzy decision trees for the tasks of alternative choices, Transport and Telecommunication Institute, Lomonosova, Latvia, Vol.12, No 2, 2011.

V. BARNETT, T. LEWIS, Outliers in Statistical Data, John Wiley, 3rd edition, 1994.

Published
2015-12-31
Section
Bài báo