Show simple item record

dc.contributor.advisorPino Angulo, Adrián
dc.contributor.authorRivas Méndez, Ariam
dc.date.accessioned2015-12-10T17:13:17Z
dc.date.available2015-12-10T17:13:17Z
dc.date.issued2014
dc.identifier.urihttp://repositorio.uho.edu.cu/jspui/handle/uho/219
dc.description.abstractLos algoritmos de clasificación basados en reglas se han destacado debido a su gran número de ventajas. Sin embargo, a pesar de todas las ventajas que poseen y la rica cantidad de algoritmos de clasificación basados en reglas descritos en la literatura científica revisada; existe escasa evidencia, de decidir cuál de estos algoritmos es más propicio para conjunto de datos de alta dimensión. Por lo que se realiza un estudio experimental de los algoritmos de clasificación basados en cubrimiento secuencial para la determinación de reglas, para su elección y aplicación. También se confecciona una taxonomía de los algoritmos de clasificación basados en reglas para una mejor comprensión y análisis. Luego se efectúa una implementación de dos nuevos algoritmos, los cuáles se caracterizan por su velocidad y una mejora al algoritmo RIPPERk. Esta consiste en reordenar las reglas del algoritmo sin afectar el tiempo de procesamiento. Se evalúa la efectividad de los principales métodos de clasificación basados en reglas ante conjuntos de datos de alta dimensión. Tomando como parámetros de evaluación la precisión, tiempo de ejecución y número de condiciones de la regla. Se hace uso de métodos estadísticos-matemáticos como la prueba no paramétricas de Friedman y la post-hoc de Holm. Esta evaluación se muestra en una gráfica para exponer los mejores clasificadores en cuanto a los parámetros seleccionados. The classification algorithms based on rules have stood out due to their great number of advantages. However, in spite of all the advantages that possess and the rich quantity of classification algorithms based on rules described in the scientific revised literature; scarce evidence exists, of deciding which of these algorithms it is more favorable for dataset of high dimension. For what is carried out an experimental study of the classification algorithms based on sequential covering for the determination of rules, for their election and application. A taxonomy of the classification algorithms is also made based on rules for a better understanding and analysis. Then an implementation of two new algorithms is made, those which they are characterized by its speed and an improvement to the algorithm RIPPERk. This consists on reordering the rules of the algorithm without affecting the time of processing. The effectiveness of the main classification methods is evaluated based on rules before datasets of high dimension. Taking as evaluation parameters the precision, time of execution and number of conditions of the rule. Use of statistical-mathematical methods is made as the non parametric test of Friedman and the post-hoc of Holm. This evaluation is shown in a graph to expose the best classifiers as for the selected parameters.es_ES
dc.language.isoeses_ES
dc.publisherFacultad de Informática-Matemática, Universidad de Holguín “Oscar Lucero Moya"es_ES
dc.subjectINFORMÁTICAes_ES
dc.subjectALGORITMOSes_ES
dc.subjectDATOS DE ALTA DIMENSIÓNes_ES
dc.subjectTABLAS DE DECISIÓNes_ES
dc.subjectALGORITMOS DE CLASIFICACIÓNes_ES
dc.titleEstudio experimental sobre algoritmos de clasificación supervisada basados en reglas en conjuntos de datos de alta dimensiónes_ES
dc.typeThesises_ES


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record