Un Validatón celebrado na USC revisou máis de 23.000 fragmentos de voz en galego
venres, 22 de marzo do 2024
No transcurso desta semana do 18 de marzo o Instituto da Lingua Galega (ILG) poñÃa en marcha un Validatón (maratón de validación de fragmentos de voz) no que trinta estudantes da Facultade de FiloloxÃa da USC, co apoio de dez persoas voluntarias, revisaban un total de 23.314 fragmentos de voz en lingua galega na plataforma Common Voice.
Trátase dunha plataforma pública de datos de voz alimentada por persoas voluntarias de todo o mundo que doan a súa voz e tamén contribúen xulgando como válidas ou non as doazóns feitas por outras persoas. O obxectivo deste proxecto colaborativo é crear grandes corpus de datos orais que poidan ser empregados para adestrar modelos de recoñecemento da fala en distintas linguas. Validar os fragmentos de voz en galego doados en Common Voice permitirá que no futuro distintas aplicacións informáticas poidan comprender as persoas que falen en lingua galega.
As campañas para a doazón e validación de voz en Common Voice enmárcanse no Proxecto Nós, que desenvolven conxuntamente o ILG e o Centro Singular de Investigación en TecnoloxÃas Intelixentes (CiTIUS).
Cómpre dicir que o número total de validacións en Common Voice realizadas no Validatón foi de 23314, o que supuxo un 64% de todos os fragmentos validados na xornada do martes en Common Voice nas 120 linguas actualmente en produción, é dicir, linguas nas que se pode doar e linguas nas que se poden validar datos.
As persoas que se achegaron ao ILG, alén de participaren no Validatón, puideron coñecer o centro. Asemade, a persoa que máis fragmentos validou, un total de 1.299, o estudante Nicolás Acebedo Torrego, recibiu un premio de 100 euros, mentres as outras nove persoas finalistas.