Investigadores da UVigo elaboran a maior análise comparativa de subtitulado humano e con IA
martes, 5 de decembro do 2023
Investigadores
da Universidade
de Vigo realizou a que sería, segundo a institución académica, a
meirande análise comparativa da calidade do subtitulado en directo
fronte ao subtitulado automático. No seu estudo constatan que a
Intelixencia Artificial avanzou un importante treito neste último
ano, pero que cómpre traballar para que se garanta a accesibilidade
de todos os colectivos no proceso. Este traballo levouse a cabo no
marco do proxecto Qualisub, que presentou os seus resultados nun foro
organizado pola Comisión Europea.
O
Foro Translating Europe, celebrado en Bruxelas, xirou arredor da
irrupción da Intelixencia Artificial nos ámbitos da tradución e a
interpretación e nas súas consecuencias. No encontro, o máis
importante sobre a tradución a nivel mundial e organizado pola
Comisión Europea, participaron os profesores da Facultade de
Filoloxía e Tradución Luis Alonso Bacigalupe e Pablo Romero Fresco,
do grupo GALMA.
Nesta
cita internacional abordáronse temas como a xestión da calidade, o
impacto das novas tecnoloxías ou a promoción das profesións
lingüísticas, analizando tanto a evolución do sector nos últimos
dez anos como as proxección de futuro. En concreto, Alonso
Bacigalupe centrouse no uso da IA para a avaliación da calidade do
subtitulado en directo e fixo unha primeira presentación do software
que un equipo de investigadores da Facultade de Filoloxía e
Tradución están a crear con esta finalidade.
Xunto
con Alonso, a Comisión Europea tamén convidou ao profesor Pablo
Romero Fresco que, de xeito presencial, presentou os resultados do
proxecto de investigación Qualisub: Un estudio regional, nacional
e internacional. Financiado polo Ministerio de Ciencia e
Innovación, o proxecto botou a andar en setembro de 2021 e rematará
en setembro de 2024, liderado pola UVigo e coa Universidade do País
Vasco, Universitat Jaume I, University of Rio Grande Texas e TVE como
socios. Durante os dous primeiros anos de traballo realizaron a maior
análise comparativa a nivel mundial da calidade de subtitulado en
directo elaborado por humanos fronte ao totalmente automático para
español, galego, catalán, éuscaro e inglés.
Os
investigadores explican que “ao tempo que aumenta o volume da
produción audiovisual en todo o mundo, aumenta tamén o número de
persoas con dificultades para comprender un texto oral, especialmente
en occidente, como consecuencia do rápido proceso de envellecemento
da poboación e da inmigración”. O subtitulado ofrece unha
alternativa comunicativa para todos estes colectivos, pero o reto
xurde cando se trata de eventos ou programas en directo que non
permiten realizar un subtitulado previo. Este é o espazo que ocupa o
lexendado en directo, que ofrece aos usuarios unha transcrición en
tempo real das palabras e sons dun evento, conferencia, retransmisión
ou mesmo de informacións de servizo público, por exemplo, nun
aeroporto.
O
que se propuxeron os investigadores do grupo GALMA é “analizar a
calidade dos subtítulos producidos en directo por profesionais
fronte aos producidos de xeito automático e centráronse en
retransmisións e acontecementos nas catro linguas oficiais do
estado: catalán, éuscaro, galego e español e tamén en inglés nos
Estados Unidos”. A finalidade, sinalan, “é poder emitir
recomendacións que poidan mellorar a accesibilidade de programas e
eventos de para millóns de espectadores diarios”. A análise,
explica Romero Fresco, realizouse empregando o sistema NER, “un
modelo de avaliación da calidade de subtítulos” que el mesmo
deseñou e que xa se ten convertido “no xeito estándar de analizar
a calidade dos subtítulos en todo o mundo, incluídas canles de TV,
plataformas, empresas e gobernos, así como a lexislación de países
como Canadá”.
No
que se refire ás comunidades autónomas, centráronse en avaliar a
precisión do recoñecemento de voz en galego, vasco e catalán, así
como a súa potencial aplicación ao subtitulado en directo. A nivel
nacional compararon a calidade dos subtítulos en directo producidos
mediante refalado por TVE, Antena3, Cuatro, Telecinco e La Sexta cos
subtítulos automáticos que emprega TVE. Finalmente, dende unha
perspectiva internacional realizaron a primeira análise a grande
escala da calidade dos subtítulos en directo nos Estados Unidos
baseado no modelo NER para comparalo cos resultados obtidos en
España.
Cos
resultados obtidos ata agora, o equipo puido constatar “un cambio
bastante importante respecto da evolución da calidade do subtitulado
automático”. Ata finais do 2022, explica Romero, a diferencia “era
bastante clara” a favor da subtitulado realizado polos humanos.
Pero dende entón, engade, “xurdiron aplicacións de última
xeración de Intelixencia Artificial que empezan a acadar resultados
moi bos, máis hai un detalle importante: as máquinas transcriben
todas as palabras, de xeito que os subtítulos son literais e moitas
veces demasiado rápidos e difíciles de ler. Isto fai que a xente
que le rápido non teña problema, mais hai xente que está excluída:
persoas maiores, inmigrantes, xordos que teñen lingua de sinais como
primeira lingua, etc”. É por isto que os docentes implicados neste
proxecto poñen o foco precisamente en non deixar a ninguén atrás:
“O noso obxectivo como formadores e o dos nosos estudantes como
futuros profesionais é asegurarse de que a automatización non se
leva a cabo en detrimento da accesibilidade para os que de verdade a
precisan”.