Estudio experimental sobre algoritmos de clasificación supervisada basados en reglas en conjuntos de datos de alta dimensión

Rivas Méndez, Ariam

dc.contributor.advisor	Pino Angulo, Adrián
dc.contributor.author	Rivas Méndez, Ariam
dc.coverage.spatial	1001296	es_ES
dc.date.accessioned	2019-07-09T15:50:17Z
dc.date.available	2019-07-09T15:50:17Z
dc.date.issued	2014-11
dc.identifier.uri	http://repositorio.uho.edu.cu/jspui/handle/uho/5712
dc.description.abstract	Los algoritmos de clasificación basados en reglas se han destacado debido a su gran número de ventajas. Sin embargo, a pesar de todas las ventajas que poseen y la rica cantidad de algoritmos de clasificación basados en reglas descritos en la literatura científica revisada; existe escasa evidencia, de decidir cuál de estos algoritmos es más propicio para conjunto de datos de alta dimensión. Por lo que se realiza un estudio experimental de los algoritmos de clasificación basados en cubrimiento secuencial para la determinación de reglas, para su elección y aplicación. También se confecciona una taxonomía de los algoritmos de clasificación basados en reglas para una mejor comprensión y análisis. Luego se efectúa una implementación de dos nuevos algoritmos, los cuáles se caracterizan por su velocidad y una mejora al algoritmo RIPPERk. Esta consiste en reordenar las reglas del algoritmo sin afectar el tiempo de procesamiento. Se evalúa la efectividad de los principales métodos de clasificación basados en reglas ante conjuntos de datos de alta dimensión. Tomando como parámetros de evaluación la precisión, tiempo de ejecución y número de condiciones de la regla. Se hace uso de métodos estadísticos-matemáticos como la prueba no paramétricas de Friedman y la post-hoc de Holm. Esta evaluación se muestra en una gráfica para exponer los mejores clasificadores en cuanto a los parámetros seleccionados.	es_ES
dc.description.abstract	The classification algorithms based on rules have stood out due to their great number of advantages. However, in spite of all the advantages that possess and the rich quantity of classification algorithms based on rules described in the scientific revised literature; scarce evidence exists, of deciding which of these algorithms it is more favorable for dataset of high dimension. For what is carried out an experimental study of the classification algorithms based on sequential covering for the determination of rules, for their election and application. A taxonomy of the classification algorithms is also made based on rules for a better understanding and analysis. Then an implementation of two new algorithms is made, those which they are characterized by its speed and an improvement to the algorithm RIPPERk. This consists on reordering the rules of the algorithm without affecting the time of processing. The effectiveness of the main classification methods is evaluated based on rules before datasets of high dimension. Taking as evaluation parameters the precision, time of execution and number of conditions of the rule. Use of statistical-mathematical methods is made as the non parametric test of Friedman and the post-hoc of Holm. This evaluation is shown in a graph to expose the best classifiers as for the selected parameters.	es_ES
dc.language.iso	spa	es_ES
dc.publisher	Universidad de Holguín, Facultad Informática Matemática, Departamento de Informática.	es_ES
dc.subject	REGLAS DE ALGORITMOS	es_ES
dc.subject	ALGORITMOS DE CLASIFICACION	es_ES
dc.subject	CONJUNTOS DE DATOS	es_ES
dc.subject.other	ALGORITMOS	es_ES
dc.subject.other	INGENIERIA INFORMATICA	es_ES
dc.subject.other	TAXOMANIA	es_ES
dc.title	Estudio experimental sobre algoritmos de clasificación supervisada basados en reglas en conjuntos de datos de alta dimensión	es_ES
dc.type	bachelorThesis	es_ES

Files in this item

Name:: Documento Tesis - a entregar.pdf
Size:: 1.057Mb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Trabajos de Diplomas de Ingeniería Informática [142]

Show simple item record