Redacción. Jorge Gracia del Río, profesor del Departamento de Informática e ingeniería de Sistemas de la Universidad de Zaragoza e investigador del Instituto de Investigación en Ingeniería de Aragón (I3A), ha sido nombrado presidente del proyecto internacional NexusLinguarum, un ecosistema que ayudará a reducir las barreras lingüísticas en Europa y favorecerá tanto el comercio electrónico como el intercambio cultural entre países de distinta lengua.
El proyecto permitirá desarrollar una red internacional de investigación en temas de «ciencia de datos lingüísticos» y aglutinará a investigadores de 38 países, expertos en lingüística, informática, web semántica, big data, etc. Otro de los objetivos de NexusLinguarum es apoyar a lenguas minoritarias, cuyo soporte tecnológico sea actualmente limitado.
El proyecto “European network for Web-centred linguistic data science”, con una duración de cuatro años, es de tipo “acción COST”. La asociación COST (European Cooperation in Science and Technology) convoca este tipo de proyectos, altamente competitivos, para financiar la formación de redes de investigación en temas emergentes, mediante mecanismos como las estancias de investigación, la organización de congresos, reuniones científicas, escuelas de verano, etc.
NexusLinguarum tendrá como fin aunar esfuerzos entre investigadores y profesionales de un gran número de países provenientes de campos tan variados como la lingüística, la terminología, las humanidades digitales, la informática, la inteligencia artificial, la ciencia de datos, etc., para investigar y extender el campo de la ciencia de datos lingüísticos. La idea es proporcionar una base para el análisis, representación, integración y explotación de datos lingüísticos tanto para el análisis del propio lenguaje como para facilitar aplicaciones tecnológicas basadas en él (traducción automática, análisis de sentimientos, generación automática de lenguaje, etc.).
“A través de la ciencia de datos lingüísticos podremos conocer mejor la naturaleza del lenguaje, mediante métodos innovadores para la representación, integración y comparación de datos lingüísticos”, explica Jorge Gracia. “Además, dado que el lenguaje es el medio en el que el conocimiento humano es transmitido, este campo tiene el potencial de influir decisivamente en estudios que hacen uso del lenguaje natural para compartir conocimientos, como es el caso de las humanidades, el dominio legal, el periodismo, las ciencias sociales, etc”.
Para permitir el estudio de los datos lingüísticos de la manera más productiva y eficiente, el proyecto dará soporte a la construcción de un ecosistema de datos lingüísticos multilingües e interoperables semánticamente a escala de la Web, y de técnicas que los procesen. Para tal fin, se combinarán métodos y técnicas de la Web Semántica, del Procesamiento del Lenguaje Natural, y de los Recursos Lingüísticos.
En la sesión de constitución de la “European network for Web-centred linguistic data science” (“NexusLinguarum”), celebrada en Bruselas hace unas semanas, los representantes de los países que componen la red eligieron al profesor Jorge Gracia del Río como presidente de la misma. Además del puesto de presidente, también se designó en esta primera reunión a John McCrae, de la National University of Ireland, Galway (Irlanda), como vice-presidente de la acción COST, y se nombró a la Universidad Politécnica de Madrid (España) como institución gestora del proyecto, cuya representante científica es la doctora Elena Montiel Ponsoda. También se nombraron el resto de cargos del comité de dirección, con representantes de la República Checa, Portugal, Alemania, Austria, Grecia y Holanda.