XeraWord, a nova ferramenta de xeración automática de galego e portugués

Esta iniciativa baséase na tradución automática de léxico extraído da base de datos do idioma inglés WordNet.

Por Galicia Confidencial | Compostela | 13/01/2021 | Actualizada ás 20:20

Comparte esta noticia

XeraWord. Esa é a nova ferramenta piloto de xeración automática da frase nominal simple en galego e portugués que desenvolve o Instituto de Lingua Galega (ILG). Elaborada no marco dun proxecto dirixido pola profesora da USC, María José Domínguez Vázquez, XeraWord baséase na tradución automática de léxico extraído da base de datos do idioma inglés WordNet.

Unha estudante fai uso de Xeraword  no seu ordenador portátil
Unha estudante fai uso de Xeraword no seu ordenador portátil | Fonte: Santi Alvite

"Para o desenvolvemento deste simulador foron deseñados unha ferramenta de tradución do caudal léxico paradigmático a partir dos datos extraídos de xeito automático do WordNet, así como un flexionador nominal", apuntan desde o ILGA a través dun comunicado. O prototipo recorre á integración de datos lingüísticos e á interoperabilidade entre recursos xa existentes. 

“A escolla destes cinco substantivos xustifícase polo seu papel de representantes de diferentes escenas cognitivas ou campos semánticos”, explica a profesora Domínguez. Este prototipo senta as bases para o futuro desenvolvemento de ferramentas de xeración argumental máis complexas

Así, destaca que a ampliación das unidades analizadas polo xerador permitirá o seu uso por parte de estudantes de galego e portugués como linguas estranxeiras ou segundas linguas. No seu estado actual, XeraWord presenta unha metodoloxía de análise que pode ser extrapolada a outras linguas e recursos. Os datos poden ser descargados en formato CSV e JSON. Isto permite a súa integración e reutilización noutros recursos.

Comparte esta noticia
¿Gústache esta noticia?
Colabora para que sexan moitas máis activando GCplus
Que é GC plus? Achegas    icona Paypal icona VISA
Comenta