O WordNet do galego xa é unha realidade

xoves, 5 de maio do 2016 Redacción

O profesor Xavier Gómez Guinovart coordina o equipo que desenvolve o GalNet, versión galega do WordNet

No marco do proxecto estatal Skater (Scenario Knowledge Adquisition by Textual Reading), no que participa a Universidade de Vigo e que durante os seus 3 anos de duración conta cun orzamento total de 400.000 euros, desenvolveuse un novo recurso de lingüística computacional, o GalNet, a versión galega do WordNet, un proxecto nacido na Universidade de Princeton que vén a ser unha base de datos léxica do inglés, agrupando as palabras en conxuntos de sinónimos, proporcionando definicións curtas e xerais e almacenando as relacións semánticas entre os conxuntos de sinónimos.
GalNet é así unha rede léxico semántica para a lingua galega, un recurso léxico estándar para todas as aplicacións informáticas que traballan coa linguaxe e que segundo o profesor Xavier Gómez Guinovart, do Seminario de Lingüística Informática, é principalmente “un dicionario electrónico para que os programas que procesan linguaxe sexan capaces de deducir o significado das frases e actuar en consecuencia”.
Un exemplo de aproveitamento desta ferramenta é o que fai Google Translate, que emprega estes recursos no proceso de tradución coas linguas que conten cun WordNet de seu. O director do Seminario de Lingüística Informática matiza que aínda que Google fai uso dun modelo estatístico para as traducións, “ás veces as inferencias estatísticas non chegan para producir unha tradución aceptable e necesita recorrer a recursos máis precisos como os dicionarios bilingües e, neste caso, o recurso multilingüe seleccionado é o WordNet, porque é o maior dicionario multilingüe tanto en número de linguas como en número de palabras e conceptos”.
GalNet conta actualmente cuns 33.000 conceptos que inclúen un total de 50.000 palabras, mentres que o inglés conta con 117.000 conceptos cubertos e 206.000 palabras, de xeito que aínda queda moito camiño por percorrer, pero o profesor Guinovart explica que a distancia débese a que o GalNet arrincou hai uns 3 anos, mentres que os traballos na Universidade de Princeton comezaron hai máis de 40.

PUBLICIDADE