Por favor, use este identificador para citar o enlazar este ítem: https://repositorio.uci.cu/jspui/handle/123456789/7918
Título : Sistema de aprendizaje automático para la clasificación de páginas web de acuerdo al interés de una entidad
Autor : Pujol Méndez, Naivy
Tutor: Porven Rubier, Joelsy
Palabras clave : CLASIFICACIÓN DE PÁGINAS WEB;PÁGINAS WEB DE INTERÉS
Fecha de publicación : 2018
Editorial : Universidad de las Ciencias Informáticas
Resumen : Entre las principales tendencias tecnológicas para 2018 se encuentran: la inteligencia artificial, el análisis inteligente y sus aplicaciones, propiciado por al aumento de la disponibilidad de los datos y la necesidad de su análisis. La Web es una de sus principales áreas de aplicación, fomentando el desarrollo de la minería Web para el descubrimiento de patrones en ella. En la Universidad de las Ciencias Informáticas, en la Dirección de Redes y Servicios Telemáticos, se almacena información sobre la navegación. Esta información puede ser utilizada para la clasificación de páginas Web de acuerdo al interés de la universidad, pero es mucha información sin procesar. Además, la clasificación de las páginas Web de interés: se realiza manualmente siendo menos que las que no lo son y no se analizan los datos existentes o su relación con los patrones de navegación de los usuarios. A partir de estas limitantes se plantea como objetivo de la investigación: desarrollar un sistema de aprendizaje automático apoyado en los patrones de navegación de los usuarios que permita clasificar las páginas Web de acuerdo al interés de una entidad. Después de un análisis del estado del arte, se concluyó que las técnicas de aprendizaje automático son las más utilizadas, su selección depende de los datos y estudios experimentales sobre ellos. La minería Web, es la encargada de estudiar los datos provenientes de la Web y su proceso define las fases: preprocesamiento, descubrimiento de los patrones y análisis de los patrones. En la primera, se analiza el conjunto de entrenamiento y se realizan las transformaciones necesarias para mejorar los resultados de los clasificadores. En la segunda fase, se analiza los parámetros, funcionamiento y entrenamiento de los clasificadores y su salida es utilizada en la tercera fase para el análisis de los patrones, así como, la validación de la solución. Los métodos estadísticos aplicados, identificó que la única métrica que presenta diferencias significativas es Acurracy y el análisis de su promedio en los clasificadores comprobó que el clasificador KNeighborsClassifier presenta los mejores resultado. Además, con los elementos teóricos y prácticos de la minería del uso de la Web, el aprendizaje automático y la clasificación automática, se desarrolló un clasificador KNeighborsClassifier utilizando los patrones de navegación de los usuarios, que permite clasificar las páginas Web de acuerdo al interés de una entidad.
URI : https://repositorio.uci.cu/jspui/handle/123456789/7918
Aparece en las colecciones: Tesis de Maestría

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Tesis.pdfTrabajo final presentado en opción al título de Máster en Informática Avanzada.1.13 MBAdobe PDFVisualizar/Abrir


Los ítems del Repositorio están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.