Sector Público
IA

Luz verde a TeresIA, el proyecto para potenciar la terminología en español mediante IA

La iniciativa, coordinada por el CSIC, se enmarca en el PERTE de la Nueva Economía de la Lengua y ha sido dotada con 1,4 millones de euros a cargo de la Secretaria de Estado de Digitalización e Inteligencia Artificial.

español, lengua, lenguaje
Créditos: Jon Tyson (Unsplash).

TeresIA nace con el firme propósito de recuperar y fomentar la terminología en español mediante la inteligencia artificial (IA) y el conocimiento experto. Un proyecto capitaneado por el Consejo Superior de Investigaciones Científicas (CSIC) que generará un metabuscador de acceso a terminologías en español de alcance panhispánico y desarrollará una metodología innovadora para la generación de léxico en español. Para ello se apoyará en la IA, pero también en las mejores capacidades humanas y conocimiento experto.

Una iniciativa cuya presentación en sociedad contó con la participación de la comisionada especial para el PERTE Nueva Economía de la Lengua, Cristina Gallach, y la investigadora que dirige el proyecto, Elea Giménez Toledo. La puesta en marcha del proyecto TeresIA: Portal de acceso a terminologías en español y servicios de inteligencia artificial ha contado también con la dotación de 1,4 millones de euros a cargo de la Secretaría de Estado de Digitalización e IA que lidera Carme Artigas.

 

Corpus de literatura científica en español

TeresIA creará un corpus de literatura científica en español; diseñará una metodología de extracción de información aplicando técnicas de IA y procesamiento del lenguaje natural (PLN) para extraer términos, mostrarlos en su contexto, validarlos, sancionarlos, transformarlos a formatos de la web de datos y hacerlos visibles y recuperables en distintos entornos, incluido el metabuscador. “Todo ello generará un enorme conjunto de datos terminológicos abiertos, siguiendo los principios FAIR, y favorecerá la interacción con comunidades de expertos a los que se implicará en los procesos de validación”, indica Giménez Toledo. “Desarrollar terminología en español en el marco de la ciencia abierta representa un avance para el multilingüismo”, señala la investigadora.

Al trabajar con estándares tecnológicos, las palabras de la ciencia en español se conectarán con las palabras de la ciencia en otros idiomas. De este modo, “se multiplican las posibilidades de recuperar y descubrir contenidos científicos en distintos idiomas. Además, se preserva la riqueza terminológica de cada lengua, se favorecen las traducciones especializadas (tanto la humanas como las automáticas), se entrenan algoritmos y se mejora la enseñanza del español de especialidades, entre otras aplicaciones”, detalla Giménez Toledo.

 

Consorcio interinstitucional

El proyecto se desarrollará conjuntamente por un consorcio conformado por seis instituciones: la Plataforma Temática Interdisciplinar (PTI) ES CIENCIA, del CSIC; el Instituto Cervantes; el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS); el grupo de Ingeniería Ontológica de la Universidad Politécnica de Madrid; la Asociación Española de Terminología (AETER) y la Real Academia de Ingeniería (RAI). Estas entidades contarán, además, con el apoyo del departamento de Lengua Española de la Dirección General de Traducción de la Comisión Europea.

La idea primigenia de TeresIA surgió hace más de quince años, pero no había podido desarrollarse hasta el momento por razones de índole diversa. El nombre del proyecto quiere reconocer el destacado trabajo de Teresa Cabré en la definición y planteamiento de esta iniciativa. La colaboración interinstitucional, los procesos innovadores introducidos en el proyecto, la visión política para apoyarlo y la oportunidad de los fondos europeos Next Generation han hecho que, finalmente, pueda materializarse. “En este momento hay que reconocer la perseverancia de Luis González (DGT) y Miguel Marañón (Instituto Cervantes) y de los distintos presidentes de AETER al no abandonar la idea”, concluía la investigadora.



Contenido Patrocinado

Forma parte de nuestra comunidad

 

¿Te interesan nuestras conferencias?

 

 
Cobertura de nuestros encuentros
 
 
 
 
Lee aquí nuestra revista de canal

DealerWorld Digital