• Login
    View Item 
    •   DSpace Home
    • Trabajos de Diploma
    • Trabajos de Diplomas de Ingeniería Informática
    • View Item
    •   DSpace Home
    • Trabajos de Diploma
    • Trabajos de Diplomas de Ingeniería Informática
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Estudio experimental de algoritmos de Selección de Atributos para la Minería de Datos

    Thumbnail
    View/Open
    2009_Selección de Atributos (Adrian Pino_apinoa).pdf (1.572Mb)
    Date
    2008-09
    Author
    Pino Angulo, Adrián
    Metadata
    Show full item record
    Abstract
    La Minería de Datos persigue analizar el comportamiento de los datos con vista a la extracción de patrones no triviales a partir de los mismos. Frecuentemente esteproceso se ve afectado por la alta dimensión de los datos, que puede presentarse en la cantidad de registros almacenados o de atributos utilizados para describirlos. Muchos de ellos generalmente no aportan información relevante a los algoritmos de aprendizaje, encargados de crear los modelos antes mencionados y por el contrario, constituyen un obstáculo que debe ser eliminado en una fase previa. Esta etapa es conocida como Preprocesamiento de datos, e incluye técnicas como la Selección de Ejemplos y de Atributos. Esta última, como su nombre lo indica, sintetiza la descripción de los objetos, de manera tal que la información sea preservada de la manera más compacta y clara posible, favoreciendo la labor de aprendizaje. En aras de facilitar este proceso, se han creado distintas herramientas que brindan a los estudiosos del tema un conjunto de algoritmos para cada una de las fases del mismo, y que permiten valorar el efecto de cada método en él. No obstante, algunas técnicas destacadas en la Selección de Atributos no son muy utilizadas a raíz de que no se encuentran en tales aplicaciones, que además carecen de vasta documentación para los algoritmos que incluyen. Una de las más populares es Weka, una herramienta libre desarrollada en lenguaje Java y que se encuentra disponible en Internet, alcanzando altos índices de popularidad a raíz también de la cantidad de métodos que incluye y su facilidad de uso. A partir de todo ello, con este trabajo investigativo se pretende incorporar algunos métodos de Selección de Atributos a Weka, como vía para generalizar el empleo de estos. Además quedan documentados en detalles tanto los algoritmos ya existentes en la aplicación como los proporcionados. Recoge además elementos teóricos de la Minería de Datos, Aprendizaje Automático y Selección de Atributos.
     
    Data Mining has, as it main goal, to analyze the behavior of the data with the purpose of getting non trivial patterns. Frequently, this process may be affected by the high dimensional data. Those data may appear as a set of stored records or attributes used to describe them. Most of them do not offer relevant information to the Machine Learning algorithms, designed to create the previous mentioned models. Just the opposite, they constitute an obstacle that most be eliminated in a previous phase. This stage is known as Data Preprocessing which includes techniques such as Instance and Attribute Selection. The latter, as its name indicates, summarizes the description of the objects in such a way that the information may be preserved in the clearest and most compressed way. It will favor the learning process. In order to facilitate the process, different tools have been created which offer specialist a set of algorithms for each of the stages. It also allow to evaluate the effect of method on it. However, some of the outstanding techniques used in Attribute Selection are frequently used due to the fact that they do not appear in those softwares, and that they do not have a detailed documentation for the algorithm they include. One of the most popular is Weka, a free tool developed in Java language, available in Internet, which has reached a tremendous popularity, due to the large quantity of methods it has and its simplicity. For all these reasons, the present research work tries to introduce some of those methods of Attribute Selection to Weka, as a way to generalize the use of them. Besides, the algorithms, those already existing in the application as well as those offered are perfectly well documented. It also includes theoretical elements of Data Mining, Machine Learning and Attribute Selection.
     
    URI
    http://repositorio.uho.edu.cu/jspui/handle/uho/5897
    Collections
    • Trabajos de Diplomas de Ingeniería Informática [142]

    Director de la Biblioteca: Dr.C. Carlos Rafael Batista Matamoros

    Portal de la Biblioteca
    Contact Us | Send Feedback
    Theme by 
    Atmire NV
     

     

    Browse

    All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

    My Account

    LoginRegister

    Director de la Biblioteca: Dr.C. Carlos Rafael Batista Matamoros

    Portal de la Biblioteca
    Contact Us | Send Feedback
    Theme by 
    Atmire NV