O Proxecto Nós e o ILG activan o 2º maratón para amplificar o galego no ámbito tecnolóxico: o Validatón

martes, 8 de abril do 2025 S. P.

O Proxecto Nós e o Instituto da Lingua Galega (ILG) impulsan unha nova edición (a segunda) do Validatón 2025, un maratón de validación de fragmentos de voz en galego para contribuír á creación de recursos para a nosa lingua en Common Voice, unha plataforma pública de datos de voz. A actividade, cuxos detalles podemos consultar na web do ILG, está dirixida a estudantes da Facultade de Filoloxía da Universidade de Santiago de Compostela e consta de dúas fases. Na primeira, que ten modalidade en liña, pódese participar dende calquera lugar realizando contribucións en Common Voice ata as 12.00 horas do 10 de abril. A segunda fase consiste nunha sesión presencial no ILG este xoves 10 en horario de 16.00 a 20.00 horas.
Segundo explican dende o Proxecto Nós, a participación no Validatón é posíbel en tres categorías: gravación de fragmentos de voz, validación de audios e xeración de frases. Ao rematar a sesión presencial no ILG, a persoa con máis contribucións totais e mais as gañadoras de cada categoría recibirán premios en metálico posíbeis grazas ao apoio de Atlantic Ponte e Imaxin Software.
O ILG e o Proxecto Nós engaden que nesta segunda convocatoria o Validatón aspira a “mellorar as boas cifras da sesión presencial da primeira edición, na que se revisaron un total de 23.314 fragmentos de voz en lingua galega en Common Voice, o que supuxo un 64% de todos os fragmentos validados nesa xornada na plataforma nas 120 linguas daquela en produción, que agora na actualidade ascenden xa a 130”.
Lembran tamén que para adestrar modelos de recoñecemento da fala cómpre utilizar grandes corpus de datos orais, “pero a maioría, en especial os que usan as grandes compañías, son datos pechados e non están dispoñíbeis”. Neste sentido, Common Voice, ao ser unha plataforma pública de datos de voz alimentada por persoas voluntarias de todo o mundo, “axuda a que as tecnoloxías sexan accesíbeis para quen as queira desenvolver”, explican, engadindo que “as persoas contribúen a Common Voice doando a súa voz e tamén xulgando como válidas ou non as doazóns feitas por outras persoas, xerando deste xeito ese corpus público que permitirá que no futuro distintas aplicacións informáticas poidan comprender as persoas que falen en galego”.
Outra iniciativa
Alén do Validatón, os coordinadores do Proxecto Nós lembran que o alumnado de grao da Universidade de Santiago de Compostela tamén pode contribuír a mellorar a presenza do galego no mundo dixital participando nunha actividade formativa de recollida e validación de datos de voz en galego certificada pola USC como formación a través do recoñecemento dun crédito ECTS.
Proxecto Nós
O Proxecto Nós é unha iniciativa para situar o galego xunto coas linguas máis desenvolvidas no ámbito da tecnoloxía da lingua e a Intelixencia Artificial. O seu obxectivo principal é xerar os recursos necesarios para facilitar o desenvolvemento de servizos e produtos baseados na tecnoloxía da lingua como asistentes de voz, tradutores automáticos ou axentes conversacionais.
En paralelo, o proxecto promove tamén a presenza dixital do galego, facilitando a creación dunha ampla variedade de ferramentas e recursos de alta calidade e de uso libre, algunhas das cales xa están á disposición e accesíbeis a través da web do proxecto para calquera persoa, institución, organización ou empresa que queira desenvolver un produto tecnolóxico, aplicación ou servizo que incorpore a lingua galega. Deste xeito, ademais de garantir os dereitos lingüísticos da comunidade galegofalante no mundo dixital, tamén se contribuirá á modernización e dixitalización do ecosistema de empresas galegas e á creación de valor con novos produtos que empreguen o galego.
O Proxecto Nós é unha iniciativa da Secretaría Xeral da Lingua (Xunta) cuxa execución foi encomendada á Universidade de Santiago de Compostela (USC), a través de dúas entidades punteiras de investigación en Intelixencia Artificial e Tecnoloxías da linguaxe: o ILG e o CiTIUS.