Estudio de resúmenes y descripciones lingüísticas
La línea de investigación se centra en el ámbito de los sistemas de datos a texto (data-to-text systems), cuyo objetivo es la generación de descripciones en lenguaje natural de los aspectos más relevantes, para un usuario concreto, de un conjunto de datos (base de datos, imágenes, videos, etc.). Dentro de esta línea general, afrontamos diversos problemas particulares tales como: el modelado de la semántica de conceptos difusos, incluyendo aquellos que son dependientes del contexto. Todo ello ha sido aplicado en la descripción de datos, particularmente series temporales e imágenes. Concretamente en este último campo se ha trabajado en el modelado de conceptos visuales difusos relativos a color, textura y forma para ser empleados como base en la descripción de imágenes.
Dentro de esta línea se han desarrollado diversas aplicaciones, entre las que destacan: una app que implementa un juego referencial basada en técnicas de búsqueda visual, destinada al aprendizaje de conceptos visuales básicos en las primeras etapas del sistema educativo; una herramienta de interacción multimodal basada en voz y tacto para la descripción de escenas para personas con discapacidad visual; y una interfaz para la descripción lingüística de series de datos temporales obtenidas mediante consultas a un datawarehouse.
A través de los trabajos de esta línea, el grupo de investigación pertenece a la Red Temática Nacional de Tratamiento Inteligente de Datos y Generación de Lenguage Natural (iGLN) y tiene un papel relevante en la creación y las tareas de la IEEE CIS Task Force on Linguistic Summarization and Description of Data.