A USC fai un chamamento ao alumnado para achegar voces ao proxecto de IA para o galego: o Proxecto Nós
venres, 10 de xaneiro do 2025
- Moza estudante empregando dispositivos para o Proxecto Nós nunha imaxe de Santi Alvite
Comezou un novo ano e prosegue a súa andaina o Proxecto Nós, impulsado pola Universidade de Santiago de Compostela e a Xunta de Galicia (Secretaría Xeral de Lingua) e desde 2023 financiado a través de fondos PERTE-Next Generation. Segundo lembraron as ditas entidades, o proxecto está mergullado na actualidade nunha recollida masiva de datos de voz en galego a través da plataforma Common Voice. A USC acompañou esta campaña dun chamamento ao seu alumnado para que contribúa ao proxecto a cambio de créditos optativos.
“O propósito”, explica a Universidade, “é dotármonos de recursos de tecnoloxía da fala en galego para garantir a comunicación con máquinas ou con outras persoas a través de máquinas, algo especialmente importante na era da Intelixencia Artificial”.
A USC lembra tamén que o galego está entre as primeiras dez linguas en Common Voice en canto ao número de frases recollidas, principalmente grazas á achega dun gran volume de frases por parte do Proxecto Nós. Engade que tralo lanzamento da fase inicial da campaña de recollida de voces hai xa case un ano, hoxe disponse de arredor de 300 horas de voces. Porén, o obxectivo está fixado en máis de 1.000 horas de gravación, “para o que son preferíbeis as contribucións de usuarios que non fan achegas puntuais, senón constantes”, explican dende a institución educativa compostelá, engadindo que co obxectivo de obter a maior cantidade de datos acordouse o recoñecemento con créditos optativos por actividade a aquel estudantado que participe tanto na recollida da súa propia voz como nas tarefas de verificación das mensaxes doutras persoas usuarias.
Requisitos
Para participar, a persoa falante de galego debe entrar na plataforma doagalego.nos.gal a través de calquera dispositivo conectado á Internet (ordenador con micrófono e sistema de reprodución de son, teléfono móbil etc.), ler unha serie de frases proporcionadas e ademais escoitar e validar as frases gravadas por outras persoas. Para que o alumnado da USC poida equivaler a súa actividade cun crédito deberá colaborar con 25 horas de gravación de voz e de validación de fragmentos xa gravados.
O seguimento da actividade das persoas participantes faise a través do seu perfil de usuario/a e da clasificación que fai automaticamente a plataforma. Para a xustificación da súa contribución cara á obtención do crédito de libre configuración, o alumnado participante terá que optar por estar visíbel na clasificación e desta forma poderá tomar unha captura de pantalla que mostre o número de fragmentos cos que contribuíu a Common Voice, tanto gravados como validados.