Propuesta de un framework para aprendizaje activo
Abstract
El aprendizaje automático es una rama de la Inteligencia Artificial, la cual se encarga
del estudio de los algoritmos que permiten a las computadoras aprender a partir de experiencia previa. Los algoritmos de clasificación tradicionales emplean solamente ejemplos etiquetados en el proceso de entrenamiento. Sin embargo, en la realidad la obtención de ejemplos etiquetados es una tarea costosa y muchas veces la tarea de etiquetado de datos requiere del esfuerzo de humanos experimentados. El aprendizaje activo es el área de estudio que tiene como principal hipótesis que si el algoritmo de aprendizaje tiene la oportunidad de elegir los datos desde donde aprende, entonces este tendrá una mejor precisión con un menor costo de entrenamiento. Un framework en el área de las ciencias de la computación es un conjunto de técnicas y herramientas que permiten el desarrollo de algún producto, abstrayendo y facilitando el desarrollo de ciertas tareas según el dominio para el cual está construido. Actualmente en el área del aprendizaje automático existen frameworks que apoyan el proceso de experimentación y desarrollo de nuevos algoritmos. Sin embargo, los mismos están restringidos solamente al área del aprendizaje supervisado y no supervisado clásico. En la presente investigación se propone un framework para el desarrollo de algoritmos con aprendizaje activo. Se analizan los elementos que integran al aprendizaje activo. Se aplican patrones de diseño y se diseña la estructura del framework. Son analizados casos de estudio haciendo uso del framework propuesto y por último se realiza un estudio de sostenibilidad. The machine learning is a subarea of the Artificial Intelligence discipline; it studies the algorithms that allow computer programs to automatically improve through experience. The traditional machine learning algorithms use only labeled examples in the training process. However, obtaining labeled examples is an expensive task and often it requires the effort of human experts. The Active Learning is the area that studies the techniques to construct better classifier with the fewer labeled examples as possible, for this purpose the active learning process has the main hypothesis that if the learning algorithm has the opportunity to choose the more informative examples for the learning of the model, then a better classifier is obtained. A framework in computer science is concerned with a set of techniques and tools that enable the development of a product. The frameworks are constructed under a specific domain and they convert the development of a product in a task easier to do. Nowadays, in the field of machine learning there exist several frameworks that support the process of experimentation and algorithm development. However, the existing frameworks are restricted to the area of the classic supervised learning, where the predictive models are constructed from a set of labeled examples. In this paper, a framework for active learning is proposed. An analysis of the different elements that compose the active learning techniques is carried out. A detailed explanation of how was analyzed, designed and implemented the framework is presented. To prove the effectiveness and usefulness of the framework proposed several case studies were analyzed. Finally a sustainability study of the framework is presented.