Un proxecto de lingüÃstica computacional do CITIC recibe financiamento do Consello Europeo de Investigación
martes, 6 de setembro do 2022
- David Villares, Elena Solera e Carlos Gómez
O Centro de Investigación en TecnoloxÃas da Información e as Comunicacións (CITIC) da UDC dá un novo salto cualitativo na transferencia de tecnoloxÃa e no seu recoñecemento internacional. O proxecto Efficient Syntactic Analysis for Large-scale Sentiment Analysis (SALSA), dirixido polo IP do centro Carlos Gómez RodrÃguez, acaba de ser seleccionado pola axencia de financiamento máis importante de Europa, o Consello Europeo de Investigación (ERC), na última convocatoria e financiado con 150.000 euros na categorÃa Proba de Concepto, a liña que dá cobertura a proxectos de innovación comercializables. SALSA é o único proxecto galego que recoñece o ERC nesta última convocatoria.
Ciencias e letras, da man para crear a linguaxe das TIC
O obxectivo de SALSA é crear algoritmos que traduzan
a linguaxe natural, moitas veces complexa para as TIC, a contornas dixitais
actuais propias da intelixencia artificial; e os códigos, ferramentas e
programas informáticos propios da chamada lingüÃstica computacional. A
investigación das tecnoloxÃas da linguaxe é a clave desta disciplina cientÃfica
que conxuga o traballo de tecnólogos como matemáticos, informáticos ou
enxeñeiros, co de lingüistas e outros especialistas das humanidades. Trátase
dun campo interdisciplinar que se ocupa do desenvolvemento de formalismos que
describen o funcionamento da linguaxe natural para que poidan ser transformados
e, por tanto, procesados, en programas executables por un dispositivo
tecnolóxico.
Este programa é a continuación do tamén financiado pola ERC
en 2016, finalizado recentemente, Fast Natural LanguageLarge-ScaleNLP
(FASTPARSE), responsable, entre outros fitos, de deseñar o algoritmo capaz de
axilizar a lectura do Quixote reducÃndoa a tan só 20 segundos sen deteriorar a
súa calidade conceptual. A finalidade deste innovador proxecto foi desenvolver
novas técnicas para mellorar a velocidade dos analizadores sintácticos da
linguaxe natural, facéndoos adecuados para o procesamento a escala web.
Software más accesible e económico
«Acelerar enormemente a análise das opinións presentes en
textos da linguaxe natural para facelas máis fáciles de interpretar pola
intelixencia artificial é o que buscamos con este proxecto», sinala Carlos
Gómez, que lembra ademais que o principal obxectivo de SALSA é «democratizar a
análise de datos de internet e redes sociais e transformalos en coñecemento
para os tomadores de decisións, utilizando os modelos e algoritmos de análises
sintácticas desenvolvidas no proxecto ERC Starting Grant FASTPARSE para crear
sistemas de análises de sentimento que sexan á vez precisos e eficientes (ao
empregar analizadores rápidos que poden procesar da orde de 1.000 oracións por
segundo en hardware estándar de consumo)», apunta o investigador do CITIC.
SALSA seguirá un modelo de negocio de software de código
aberto e pretende contribuÃr, en gran medida, á competitividade do mercado
tecnolóxico da UE, «reducindo a súa dependencia do oligopolio de xigantes
tecnolóxicos. Ademais de crear oportunidades para idiomas como o galego, non
prioritarios para as multinacionais», lembra. A misión do CITIC con este e
outros proxectos de similar alcance é demostrar que facer ciencia de vangarda
en Galicia é posible. «Ciencia que sexa capaz de transferirse á sociedade e
que, adicionalmente, se desenvolva desde o punto de vista industrial. A
captación de proxectos de primeiro nivel como este ERC dan boa conta diso»,
asegura o investigador principal do CITIC.