O ILG lanza a nova ferramenta de xeración automática de galego e portugués XeraWord
xoves, 14 de xaneiro do 2021
- Unha estudante da USC traballando nun computador/ Imaxe de Santi Alvite
A
Universidade de Santiago informou de que Xeraword, a ferramenta de
xeración automática de galego e portugués, xa
está dispoñíbel na páxina web do Instituto de Lingua Galega
(ILG). Elaborada no
marco dun proxecto dirixido pola profesora da USC, María José
Domínguez Vázquez, XeraWord baséase na tradución automática de
léxico extraído da base de datos do idioma inglés WordNet.
A
USC lembra que para o desenvolvemento deste simulador foron deseñados
unha ferramenta de tradución do caudal léxico paradigmático a
partir dos datos extraídos de xeito automático do WordNet, así
como un flexionador nominal. O prototipo recorre á integración de
datos lingüísticos e á interoperabilidade entre recursos xa
existentes. Como prototipo xera datos para cinco substantivos en
galego e portugués, en concreto: gl. aumento | pt. aumento, gl.
discusión | pt. discussão, gl. fuxida | pt. fuga, gl. olor | pt.
cheiro e gl. presenza | pt. presença.
Segundo
explica a profesora Domínguez Vázquez, “a escolla destes cinco
substantivos xustifícase polo seu papel de representantes de
diferentes escenas cognitivas ou campos semánticos”, engadindo que
o prototipo senta os alicerces para o futuro desenvolvemento de
ferramentas de xeración argumental máis complexas.
Aplicacións
e posibilidades da ampliación
A
ampliación das unidades analizadas polo xerador permitirá o seu uso
por parte de estudantes de galego e portugués como linguas
estranxeiras ou segundas linguas. No seu estado actual, XeraWord
presenta unha metodoloxía de análise que pode ser extrapolada a
outras linguas e recursos.