Sistemas basados en Reglas Difusos Genéticos para la minería de datos
Abstract
En la actualidad el uso de Algoritmos Genéticos para el diseño de Sistemas Basados en Reglas Difusas con capacidades de aprendizaje y adaptación ha dado lugar a los Sistemas Basados en Reglas Difusos Genéticos, los cuales han cobrado bastante auge y se han aplicado a la Minería de Datos, para descubrir conocimiento útil.En los últimos años se puede encontrar una gran cantidad de publicaciones con propuestas novedosas de este tipo de sistemas. Sin embargo los estudios experimentales realizados por los autores presentan puntos débiles en cuanto a las comparaciones con sistemas similares y la reproducción de los experimentos, debido a la falta de los datos con que se realizaron y de los valores de los parámetros de los algoritmos. Además el uso de herramientas de análisis estadístico constituyen una imperiosa necesidad en el estudio de los Sistemas Basados en Reglas Difusos Genéticos.
Esta investigación está enfocada a la realización de un estudio experimental con varios Sistemas Basados en Reglas Difusos Genéticos, que se encuentran incluidos en la herramienta para la Minería de Datos, KEEL. Comprende la descripción de varios de estos sistemas, los cuales son comparados de acuerdo a diversos criterios usando dos tests estadísticos no paramétricos. Es importante destacar que las bases de datos usadas para probar los algoritmos también se encuentran explícitas y son fácilmente accesibles. Además recoge los fundamentos teóricos de Descubrimiento de Conocimiento en Bases de Datos, Minería de Datos, Aprendizaje Automático, Sistemas Basados en Reglas Difusas, Algoritmos Genéticos y Sistemas Basados en Reglas Difusos Genéticos. Nowadays Genetic Algorithms have been widely used to create Fuzzy Rules Based Systems with added learning capabilities. These systems are known as Genetic Fuzzy Rules Based Systems and they have been successfully applied in Data Mining to discover useful information. In the last years a lot of publications that present a novel proposal of this kind of systems can be found. However the experimental studies made by the authors have some critical points as regards: the comparison with similar system and the reproduction of the experiments, due to the lack of the data used and the parameters values of the algorithms. Besides the use of statistical analysis tools is a peremptory necessity in the analysis of the Genetic Fuzzy Rules Based Systems. This investigation is focused to carry out an experimental study with some Genetic Fuzzy Rules Based Systems included in KEEL, which is a Data Mining tool. The description of every one these systems is contained and they are
compared according to several criteria using two no-parametric statistical test. It is important to mention that the data bases used to test the algorithms are explicit as well and they are easily accessible. Furthermore this work gathers the theoretical basis of Knowledge Discovery in Databases, Data Mining, Machine Learning, Fuzzy Rules Based Systems, Genetic Algorithms and Genetic Fuzzy Rules Based Systems.