Investigadores da UVigo elaboran a maior análise comparativa de subtitulado humano e con IA

martes, 5 de decembro do 2023 S. P.

Investigadores da Universidade de Vigo realizou a que sería, segundo a institución académica, a meirande análise comparativa da calidade do subtitulado en directo fronte ao subtitulado automático. No seu estudo constatan que a Intelixencia Artificial avanzou un importante treito neste último ano, pero que cómpre traballar para que se garanta a accesibilidade de todos os colectivos no proceso. Este traballo levouse a cabo no marco do proxecto Qualisub, que presentou os seus resultados nun foro organizado pola Comisión Europea.
O Foro Translating Europe, celebrado en Bruxelas, xirou arredor da irrupción da Intelixencia Artificial nos ámbitos da tradución e a interpretación e nas súas consecuencias. No encontro, o máis importante sobre a tradución a nivel mundial e organizado pola Comisión Europea, participaron os profesores da Facultade de Filoloxía e Tradución Luis Alonso Bacigalupe e Pablo Romero Fresco, do grupo GALMA.
Nesta cita internacional abordáronse temas como a xestión da calidade, o impacto das novas tecnoloxías ou a promoción das profesións lingüísticas, analizando tanto a evolución do sector nos últimos dez anos como as proxección de futuro. En concreto, Alonso Bacigalupe centrouse no uso da IA para a avaliación da calidade do subtitulado en directo e fixo unha primeira presentación do software que un equipo de investigadores da Facultade de Filoloxía e Tradución están a crear con esta finalidade.
Xunto con Alonso, a Comisión Europea tamén convidou ao profesor Pablo Romero Fresco que, de xeito presencial, presentou os resultados do proxecto de investigación Qualisub: Un estudio regional, nacional e internacional. Financiado polo Ministerio de Ciencia e Innovación, o proxecto botou a andar en setembro de 2021 e rematará en setembro de 2024, liderado pola UVigo e coa Universidade do País Vasco, Universitat Jaume I, University of Rio Grande Texas e TVE como socios. Durante os dous primeiros anos de traballo realizaron a maior análise comparativa a nivel mundial da calidade de subtitulado en directo elaborado por humanos fronte ao totalmente automático para español, galego, catalán, éuscaro e inglés.
Os investigadores explican que “ao tempo que aumenta o volume da produción audiovisual en todo o mundo, aumenta tamén o número de persoas con dificultades para comprender un texto oral, especialmente en occidente, como consecuencia do rápido proceso de envellecemento da poboación e da inmigración”. O subtitulado ofrece unha alternativa comunicativa para todos estes colectivos, pero o reto xurde cando se trata de eventos ou programas en directo que non permiten realizar un subtitulado previo. Este é o espazo que ocupa o lexendado en directo, que ofrece aos usuarios unha transcrición en tempo real das palabras e sons dun evento, conferencia, retransmisión ou mesmo de informacións de servizo público, por exemplo, nun aeroporto.
O que se propuxeron os investigadores do grupo GALMA é “analizar a calidade dos subtítulos producidos en directo por profesionais fronte aos producidos de xeito automático e centráronse en retransmisións e acontecementos nas catro linguas oficiais do estado: catalán, éuscaro, galego e español e tamén en inglés nos Estados Unidos”. A finalidade, sinalan, “é poder emitir recomendacións que poidan mellorar a accesibilidade de programas e eventos de para millóns de espectadores diarios”. A análise, explica Romero Fresco, realizouse empregando o sistema NER, “un modelo de avaliación da calidade de subtítulos” que el mesmo deseñou e que xa se ten convertido “no xeito estándar de analizar a calidade dos subtítulos en todo o mundo, incluídas canles de TV, plataformas, empresas e gobernos, así como a lexislación de países como Canadá”.
No que se refire ás comunidades autónomas, centráronse en avaliar a precisión do recoñecemento de voz en galego, vasco e catalán, así como a súa potencial aplicación ao subtitulado en directo. A nivel nacional compararon a calidade dos subtítulos en directo producidos mediante refalado por TVE, Antena3, Cuatro, Telecinco e La Sexta cos subtítulos automáticos que emprega TVE. Finalmente, dende unha perspectiva internacional realizaron a primeira análise a grande escala da calidade dos subtítulos en directo nos Estados Unidos baseado no modelo NER para comparalo cos resultados obtidos en España.
Cos resultados obtidos ata agora, o equipo puido constatar “un cambio bastante importante respecto da evolución da calidade do subtitulado automático”. Ata finais do 2022, explica Romero, a diferencia “era bastante clara” a favor da subtitulado realizado polos humanos. Pero dende entón, engade, “xurdiron aplicacións de última xeración de Intelixencia Artificial que empezan a acadar resultados moi bos, máis hai un detalle importante: as máquinas transcriben todas as palabras, de xeito que os subtítulos son literais e moitas veces demasiado rápidos e difíciles de ler. Isto fai que a xente que le rápido non teña problema, mais hai xente que está excluída: persoas maiores, inmigrantes, xordos que teñen lingua de sinais como primeira lingua, etc”. É por isto que os docentes implicados neste proxecto poñen o foco precisamente en non deixar a ninguén atrás: “O noso obxectivo como formadores e o dos nosos estudantes como futuros profesionais é asegurarse de que a automatización non se leva a cabo en detrimento da accesibilidade para os que de verdade a precisan”.