Web Semántica
Nuevos portales web de Hispavista basados en tecnologías 3.0 y Web Semántica
En este proyecto se trata de diseñar un sistema de recomendación de noticias que sea capaz de relacionar noticias de acuerdo a un criterio satisfactorio para el usuario.
Para ello se propone la utilización de técnicas de recuperación de la información (RI) junto con técnicas de Procesamiento del Lenguaje Natural (PLN). De esta forma, se pretende obtener un sistema automático que "comprenda" los contenidos de un documento web y realice una búsqueda, en el conjunto general de noticias, cuyo resultado sean otros documentos con contenidos similares. El problema es encontrar la forma más adecuada, de acuerdo a los criterios del usuario, de representar y relacionar los documentos web que aparecen en Globedia y que provienen además de fuentes muy diferentes
Cabe mencionar, por otra parte, que en este proyecto no se trata de resolver un problema de RI clásico, en el que un usuario realiza una query (o demanda de información) y el sistema le proporciona el conjunto de documentos más relevante relacionados con ella. En lugar de una query, partimos en este caso de otro documento que habrá que relacionar con documentos similares. Por lo tanto, la adaptación de las técnicas de RI al problema que nos ocupa es otro de los puntos a abordar en este proyecto.
Esta cuestión está estrechamente relacionada con el modelo seleccionado puesto que en cada caso puede que sea conveniente adoptar diferentes soluciones. Se propone por un lado representar el documento de la misma forma que la query en el caso del modelo vectorial. Así mismo se tratará de utilizar como query la etiquetas que el usuario asocia a cada una de las noticias que va introduciendo en Globedia para el caso del modelo probabilístico.
Actividades realizadas por el centro
En este proyecto la UPV ejerció como formador del equipo de Hispavista Labs en las técnicas de Procesamiento de Lenguaje Natural y Machine Learning necesarias para el desarrollo del proyecto, siendo todos los desarrollos llevados a cabo por el equipo de Hispavista Labs y supervisados por personal de la UPV.
El proceso de desarrollo incluía la preparación de datos, prueba de algoritmos, tuneo y validación de los mismos, y su posterior despliegue en entornos de producción, siempre para el portal de Globedia.com
Fecha de inicio: 01-09-2011
Fecha de fin: 31-12-2013
Participantes
Áreas tecnológicas
Líneas estratégicas
Comparte este proyecto