Carlos Gómez (CITIC) presenta en Kioto os seus proxectos sobre lingüística computacional

xoves, 27 de marzo do 2025 S. P.

O investigador do CITIC da Universidade da Coruña, Carlos Gómez, especialista en lingüística computacional, falou na Universidade de Kioto (Xapón) sobre o potencial dos chamados modelos LLM (modelos de linguaxe de gran tamaño), dirixidos a adaptar a linguaxe natural a contornas virtuais e dispositivos tecnolóxicos, no obradoiro Unit End-Year Workshop 2025: Data-Oriented Approaches to the Social Sciences and Humanities.
O Premio Nacional de Investigación expuxo os primeiros resultados dun estudo comparativo que están a desenvolver no CITIC sobre as diferenzas entre textos LLM e textos humanos; o seu potencial, os seus inconvenientes e a recomendación de expor un escenario con múltiples vías para seguir traballando nesta liña. Máis idiomas, modelos a medida ou considerar a influencia de xénero son algúns dos camiños que apunta o investigador.
A misión do CITIC coa participación nesta cita, así como noutras iniciativas de carácter internacional, é “demostrar que facer ciencia de vangarda en Galicia é posíbel”, poñendo o foco nunha “ciencia que sexa capaz de transferirse á sociedade e que, adicionalmente, sexa desenvolvida o punto de vista funcional”.
O CITIC explica que o obxectivo do proxecto presentado no Xapón é crear algoritmos que “traduzan” a linguaxe natural, un proceso moitas veces complexo para as TIC (Tecnoloxías da Información e a Comunicación), a contornas dixitais actuais propias da Intelixencia Artificial; e os códigos, ferramentas e programas informáticos propios da chamada lingüística computacional.
“A investigación das tecnoloxías da linguaxe é a clave desta disciplina científica que conxuga o traballo de tecnólogos como matemáticos, informáticos ou enxeñeiros, co de lingüistas e outros especialistas das humanidades”, apuntan o centro da UDC, engadindo que “estamos ante un eido interdisciplinar que se ocupa do desenvolvemento de formalismos que describen o funcionamento da linguaxe natural para que poidan ser transformados e, por tanto, procesados, en programas executables por un dispositivo tecnolóxico”.
Os resultados presentados aplican os resultados dun proxecto dirixido polo mesmo investigador do CITIC, no que se desenvolveron novas técnicas para mellorar a velocidade dos analizadores sintácticos da linguaxe natural, facéndoos adecuados para o procesamento a escala web. Estas técnicas tamén se demostraron útiles para analizar e comparar grandes volumes de textos xerados por humanos e LLMs.