Common Voice facilita a recollida da diversidade dialectal do galego
luns, 21 de xullo do 2025
A plataforma colaborativa Common Voice, promovida por Mozilla e nutrida por doazóns de persoas voluntarias de todo o mundo, incorpora unha nova funcionalidade para o recoñecemento da fala, denominada Fala Espontánea que permitirá rexistrar doazóns con acentos diversos, variantes léxicas e morfolóxicas, cambios de código e outros trazos caracterÃsticos da oralidade que adoitan desaparecer na fala lida.
Ata o momento, as contribucións a esta plataforma, que ten como obxectivo crear recursos abertos para o recoñecemento da fala, baseábanse en gravacións de lecturas en voz alta de textos de dominio público. A nova funcionalidade, actualmente en fase de probas, abre a porta á recollida dunha fala máis natural, diversa e representativa do uso cotián da lingua: mediante preguntas sinxelas dispoñibles en Common Voice, os voluntarios poderán gravar respostas breves e espontáneas que reflictan a súa variedade dialectal.
Con esta ferramenta, Common Voice reforza o seu compromiso coa diversidade lingüÃstica e coa accesibilidade dixital, ao tempo que facilita a participación de falantes de distintas idades, rexións e niveis de alfabetización dixital. Asà mesmo, recoñece e pon en valor a fala real, rica en matices e moito máis representativa do uso actual da lingua ca os textos escritos tradicionais.
Como funciona Fala Espontánea
Na sección Fale da plataforma Common Voice, ao escoller a opción Responder preguntas, os colaboradores poden gravar as súas respostas. Ademais, tamén poden participar transcribindo as respostas doutras usuarias e validando esas transcricións, contribuÃndo asà á creación dun corpus de fala de calidade.
O Instituto da Lingua Galega (ILG), a través do Proxecto Nós, colaborou na elaboración do primeiro conxunto de preguntas para recoller fala espontánea en galego. Non obstante, calquera persoa pode propoñer novas preguntas mediante a propia plataforma, o que garante que os contidos evolucionen de maneira aberta e participativa.
As achegas recollidas a través de Fala Espontánea conformarán un conxunto de datos independente, que se publicará baixo licenza CC0, en coherencia coa filosofÃa de datos abertos de Common Voice. Isto permitirá que investigadoras, lingüistas e outras persoas interesadas accedan libremente a datos de fala espontánea en galego, promovendo o desenvolvemento de tecnoloxÃas inclusivas e plurais, adaptadas ás necesidades reais das persoas usuarias, e fomentando a ciencia aberta e cidadá.
Proxecto Nós
O Proxecto Nós é unha iniciativa que busca situar o galego ao nivel das linguas máis avanzadas no ámbito das tecnoloxÃas da lingua e da Intelixencia Artificial. A súa finalidade principal é xerar os recursos necesarios para favorecer o desenvolvemento de servizos e produtos baseados nestas tecnoloxÃas, como asistentes de voz, tradutores automáticos ou axentes conversacionais.
Ao mesmo tempo, a iniciativa impulsa a presenza dixital do galego, facilitando a creación e difusión de ferramentas e recursos de alta calidade e de uso libre. Entre os recursos dispoñibles na web do proxecto atópanse un tradutor neuronal multilingüe, un recoñecedor de voz que transcribe a fala a texto e unha aplicación de sÃntese que permite escoitar contidos en galego. Estes recursos están ao alcance de calquera persoa, institución ou empresa interesada en integrar o galego en produtos tecnolóxicos, aplicacións ou servizos. AsÃ, non só se garante o dereito da comunidade galegofalante a participar plenamente no mundo dixital, senón que tamén se promove a modernización e dixitalización do tecido empresarial galego, xerando valor a través de novos produtos en lingua galega.
O Proxecto Nós é unha proposta impulsada pola Xunta de Galicia, que encargou a súa execución á Universidade de Santiago de Compostela (USC) mediante dúas entidades de referencia na investigación en Intelixencia Artificial e tecnoloxÃas lingüÃsticas: o Instituto da Lingua Galega (ILG) e o Centro Singular de Investigación en TecnoloxÃas Intelixentes (CiTIUS). Na actualidade, conta co financiamento do Ministerio para a Transformación Dixital e da Función Pública a través de fondos da Unión Europea–NextGenerationEU, no marco do proxecto ILENIA.
