AtlanTTic e Balidea buscan voces en galego para ensinar á tecnoloxía a entender e falar na nosa lingua
martes, 21 de febreiro do 2023- Laura Docío, Abel Caballero, Mónica Valderrama e Lorenzo Rodríguez na presentación do proxecto
Adestrar
os algoritmos de Intelixencia Artificial que usan os axentes
conversacionais por voz a través de gravacións de voces (datasets)
de persoas falando galego, co obxectivo último de que as tecnoloxías
entendan e se comuniquen na nosa lingua, é
o gran obxectivo dun revolucionario proxecto desenvolvido por dúas
investigadoras de AtlanTTic (Carmen García Mateoo e Laura Docío
Fernández) e a empresa tecnolóxica Balidea. A intención é que
as persoas galegofalantes non se sintan excluídas nas súas
conversas con voz e que, ademais, poidan levar a acabo trámites,
operacións e actividades de todo tipo.
O
proxecto ten o seu alicerce nun informe das dúas investigadoras do
Centro de Investigación en Tecnoloxías de Telecomunicación (centro
atlanTTic da UVigo), no marco da súa participación no proxecto
europeo ELE (European Language Equality), informe no que se puxo de
manifesto que “aínda queda moito por facer para que as tecnoloxías
da fala en galego funcionen igual de ben que o fan noutras linguas
nas que si se dispoñen de moitos recursos, como por exemplo o
inglés”.
É
neste contexto no que nace falAI, que, como dixemos, ten o
obxectivo de recoller voces en galego que permitan xerar ferramentas
de interacción co mundo dixital na nosa lingua. Co cancelo
#A30frases, o centro de investigación e a empresa procuran a
participación do maior número de persoas posíbel, que de xeito
anónimo, graven a súa voz lendo 30 frases, indicadas a través da
plataforma falai.balidea.com,
coas que se compoñerá un corpus lingüístico que permita adestrar
un asistente conversacional por voz. O proxecto foi presentado
publicamente estes días no edificio Redeiras da UVigo, nun acto
presidido polo alcalde de Vigo, Abel Caballero, e no que tamén
participaron a vicerreitora de Comunicación e Relacións
Institucionais, Mónica Valderrama; a investigadora principal do
proxecto, Laura Docío e o director xeral de Balidea, Lorenzo
Rodríguez.
Segundo
explicou Laura Docío, investigadora principal de falAI, “temos o
reto de acadar 6.000 participantes, cumprindo ademais os criterios de
que 30 horas de gravación correspondan a persoas de máis de 50
anos; 10 horas correspondan a cada provincia e cun equilibrio de
xénero de 40-60%”.
Docío,
xunto á catedrática do mesmo departamento, Carmen García Mateo, e
ao tamén investigador e persoal do departamento de I+D+i de Balidea,
Andrés Piñeiro Martín, conforman o equipo que está a desenvolver
falAI. “O único requisito que deben cumprir as persoas que queiran
participar no proxecto é que sexan maiores de idade. Canta maior
diversidade de voces teñamos mellor”, sinala Docio, que sinala que
as voces se recollerán de forma anónima, “non se rexistran datos
persoais sensíbeis que poidan identificar ás persoas participantes.
Ademais, estas voces estarán dispoñibles con fins de investigación
no ámbito das tecnoloxías da fala”, detalla a investigadora.
Ademais
de recadar voces que falen en galego, que permitirán xerar
datasets neste idioma en dominios como a saúde ou os trámites
administrativos, falAI tamén ten o obxectivo de facer un estudo que
sirva de guía no deseño e posta en marcha de axentes
conversacionais por voz en linguas con baixos recursos, con datasets
moi limitados en canto ao número de horas de gravacións dispoñíbeis
e á cantidade doutros recursos lingüísticos.
O
proxecto falaAI enmárcase dentro da colaboración que as dúas
investigadoras de AtlanTTic teñen en marcha coa empresa Balidea
desde hai dous anos e que se formalizou coa concesión dunha axuda
da Xunta de Galicia para o desenvolvemento da tese de doutoramento de
Andrés Piñeiro no campo dos axentes conversacionais por voz en
galego, en particular en aplicacións onde a poboación obxectivo
sexa xente maior.
O
equipo de investigación, conformado por personal de Balidea e as
investigadoras da UVigo, tamén acadou 22.500€ de financiamento
nunha convocatoria aberta do proxecto europeo European Language
Equality-ELE para a contribución na Strategic research,
innovation and implementation agenda for achieving full digital
language equality in Europe by 2030 (SRIA). Na convocatoria
seleccionáronse nove proxectos e un deles foi o presentado por
Balidea, e no que ía como parte do equipo de traballo a UVigo,
titulado Building E2E spoken-language understanding systems for
virtual assistants in low-resources scenarios.