Web Semántica

Nuevos portales web de Hispavista basados en tecnologías 3.0 y Web Semántica.

Fechas

01/09/2011 –
31/12/2014

Participantes

Hispavista S.L., Hispavista Labs, UPV-EHU (Pattern Recognition & Speech Technology)

Tecnologías Aplicadas

Data Science

Líneas estratégicas

Sistemas inteligentes

En este proyecto se trata de diseñar un sistema de recomendación de noticias que sea capaz de relacionar noticias de acuerdo a un criterio satisfactorio para el usuario.

Para ello se propone la utilización de técnicas de recuperación de la información (RI) junto con técnicas de Procesamiento del Lenguaje Natural (PLN). De esta forma, se pretende obtener un sistema automático que “comprenda” los contenidos de un documento web y realice una búsqueda, en el conjunto general de noticias, cuyo resultado sean otros documentos con contenidos similares. El problema es encontrar la forma más adecuada, de acuerdo a los criterios del usuario, de representar y relacionar los documentos web que aparecen en Globedia y que provienen además de fuentes muy diferentes

Cabe mencionar, por otra parte, que en este proyecto no se trata de resolver un problema de RI clásico, en el que un usuario realiza una query (o demanda de información) y el sistema le proporciona el conjunto de documentos más relevante relacionados con ella. En lugar de una query, partimos en este caso de otro documento que habrá que relacionar con documentos similares. Por lo tanto, la adaptación de las técnicas de RI al problema que nos ocupa es otro de los puntos a abordar en este proyecto.

Esta cuestión está estrechamente relacionada con el modelo seleccionado puesto que en cada caso puede que sea conveniente adoptar diferentes soluciones. Se propone por un lado representar el documento de la misma forma que la query en el caso del modelo vectorial. Así mismo se tratará de utilizar como query la etiquetas que el usuario asocia a cada una de las noticias que va introduciendo en Globedia para el caso del modelo probabilístico.

Actividades realizadas por el centro

En este proyecto la UPV ejerció como formador del equipo de Hispavista Labs en las técnicas de Procesamiento de Lenguaje Natural y Machine Learning necesarias para el desarrollo del proyecto, siendo todos los desarrollos llevados a cabo por el equipo de Hispavista Labs y supervisados por personal de la UPV.

El proceso de desarrollo incluía la preparación de datos, prueba de algoritmos, tuneo y validación de los mismos, y su posterior despliegue en entornos de producción, siempre para el portal de Globedia.com

Más Casos de éxito

Colabora con nosotros

Conviértete en partner y colaboremos juntos para sacar adelante iniciativas innovadoras con futuro.

"*" señala los campos obligatorios

Este campo es un campo de validación y debe quedar sin cambios.

Synergies