O WordNet do galego xa é unha realidade
xoves, 5 de maio do 2016
- O profesor Xavier Gómez Guinovart coordina o equipo que desenvolve o GalNet, versión galega do WordNet
No marco do proxecto
estatal Skater (Scenario Knowledge Adquisition by Textual Reading), no que
participa a Universidade de Vigo e que durante os seus 3 anos de duración conta
cun orzamento total de 400.000 euros, desenvolveuse un novo recurso de
lingüística computacional, o GalNet, a versión galega do WordNet, un proxecto nacido na
Universidade de Princeton que vén a ser unha base de datos léxica do inglés,
agrupando as palabras en conxuntos de sinónimos, proporcionando definicións
curtas e xerais e almacenando as relacións semánticas entre os conxuntos de sinónimos.
GalNet
é así unha rede léxico semántica para a lingua galega, un recurso léxico
estándar para todas as aplicacións informáticas que traballan coa linguaxe e
que segundo o profesor Xavier Gómez Guinovart, do Seminario de Lingüística
Informática, é principalmente “un dicionario electrónico para que os programas
que procesan linguaxe sexan capaces de deducir o significado das frases e
actuar en consecuencia”.
Un exemplo de aproveitamento desta ferramenta é o que fai Google Translate, que
emprega estes recursos no proceso de tradución coas linguas que conten cun
WordNet de seu. O director do Seminario de Lingüística Informática matiza que
aínda que Google fai uso dun modelo estatístico para as traducións, “ás veces
as inferencias estatísticas non chegan para producir unha tradución aceptable e
necesita recorrer a recursos máis precisos como os dicionarios bilingües e,
neste caso, o recurso multilingüe seleccionado é o WordNet, porque é o maior
dicionario multilingüe tanto en número de linguas como en número de palabras e
conceptos”.
GalNet conta actualmente cuns
33.000 conceptos que inclúen un total de 50.000 palabras, mentres que o inglés
conta con 117.000 conceptos cubertos e 206.000 palabras, de xeito que aínda
queda moito camiño por percorrer, pero o profesor Guinovart explica que a
distancia débese a que o GalNet arrincou hai uns 3 anos, mentres que os
traballos na Universidade de Princeton comezaron hai máis de 40.