ILENIA chega ao seu remate coa publicación de máis de 150 recursos e 14 prototipos desenvolvidos

venres, 2 de xaneiro do 2026 S. P.

ILENIA (Impulso das Linguas en Intelixencia Artificial) fixo balance da súa actividade dende xaneiro de 2023, intre no que foi posta en marcha esta iniciativa concibida como un proxecto común e coordinada entre as diferentes linguas oficiais do Estado. Nel encadrouse polo tanto o desenvolvemento do Proxecto Nós, impulsado dende Galicia (Secretaría Xeral da Lingua e USC) para posibilitar a plena actividade do galego na IA.
En concreto, o obxectivo final de ILENIA era o desenvolvemento de recursos multilingües, especialmente modelos multilingües de texto, voz e tradución automática que respondesen ás necesidades da sociedade e estivesen en consonancia coa tecnoloxía actual, nos que o multilingüismo e a transferencia entre linguas xogan un papel fundamental.
Durante os tres anos do proxecto os catro centros da rede ILENIA —o Barcelona Supercomputing Center (centro coordinador), o CENID de Alacant, o HiTZ da Universidade do País Vasco e o centro CiTIUS da Universidade de Santiago de Compostela— desenvolveron ata 158 recursos, incluíndo conxuntos de datos, modelos de texto, voz e tradución, ademais de lanzar 14 prototipos. Deste xeito, o proxecto sentou as bases para a creación dunha infraestrutura pública de IA, xunto cos proxectos Aina e ALIA.
Entre os diferentes recursos desenvolvidos cómpre destacar que ILENIA conta cun total de 67 conxuntos de datos publicados. Entre os recursos de ILENIA, hai ata 26 modelos de texto que foron unha peza fundamental no adestramento de modelos máis grandes como o 40B de ALIA, dos cales cómpre salientar os modelos Salamandra (BSC-CNS), Latxa (HiTZ), Carballo (USC) e Aitana (CENID).
Os modelos de tradución automática (TA) tamén foron un punto clave entre os recursos desenvolvidos, con ata 27 modelos de TA dispoñibles publicamente e abertamente. Neste caso, hai modelos de TA como o SalamandraTA 7B Instruct que alcanzaron as 236.962 descargas nun mes en HuggingFace.
No eido das tecnoloxías da voz, xeráronse ata 42 modelos de voz, e o multilingüismo é o principal eixo vertebrador. Obtivéronse miles de horas de gravacións para poder desenvolver cada un dos modelos, destacando, por exemplo, o Conformador Catalán-Español para ASR, que supera as 7 mil horas e inclúe 120 millóns de parámetros.
Moitos destes recursos desenvolvidos no marco do proxecto foron empregados no desenvolvemento de demostradores —prototipos operativos— que mostran aplicacións prácticas baseadas en modelos lingüísticos e intelixencia artificial. Cada demostrador foi deseñado para resolver un reto específico e foi liderado por un dos centros da rede ILENIA.
Deste xeito, desenvolvéronse ata 14 demostradores, con impacto en 9 sectores de aplicación e empregando ata 8 tecnoloxías lingüísticas diferentes.
O proxecto chega ao seu fin con máis de 150 recursos desenvolvidos, 14 prototipos e múltiples acordos con empresas e administracións do sector, “demostrando que aínda queda moito camiño por percorrer no eido da IA ​​e as tecnoloxías lingüísticas, conscientes do gran compromiso público”, en palabras das entidades impulsoras da rede.