O Centro Ramón Piñeiro presenta a nova versión do Corpus de Referencia do Galego, que permite recoñecer formas con seseo

venres, 21 de xuño do 2024 S. P.


O Pazo de San Roque en Santiago acolleu este venres 21 de xuño a presentación da versión 4.1 do Corpus de Referencia do Galego Actual (CORGA), unha ferramenta lingüística en liña desenvolvida polo Centro Ramón Piñeiro para a Investigación en Humanidades e representativa do uso lingüístico do galego actual. Esta nova versión ten como unha das súas principais novidades a de permitir o recoñecemento de formas coas de seseo. Na cita participou o secretario xeral da Lingua, Valentín García, quen puxo en valor este recurso informático polo seu carácter “potente, flexíbel, amigábel e tamén innovador” e que considerou “de suma utilidade” para extraer datos da lingua galega actual. De igual xeito, salientou que facilitar estudos desde múltiples perspectivas e investigación “cada vez máis amplas e variadas”.
O secretario xeral da Lingua lembrou que se trata dun corpus documental aberto a través de Internet que abrangue cronoloxicamente desde 1975 ata a actualidade. Ten como obxectivo, segundo concretou, o de “fornecer datos para o estudo da lingua galega actual” desde múltiples perspectivas: léxica, morfolóxica, sintáctica, fraseolóxica, terminolóxica ou comunicativa.
Valentín García salientou o valor da actualización do Corpus xa que con este “novo paso” amplíase a un total de 45.665.649 as palabras ortográficas (54.737.277 elementos gramaticais), o que supón “un corpus pequeno pero cunha rica codificación”. Neste senso, considerou de relevancia estas cifras, xa que asegurou que “contrastan con corpus noutras linguas de miles de millóns de palabras construídos a partir de Internet, pero cunha escasa codificación”.
Ademais do recoñecemento de formas con seseo, o secretario xeral da Lingua apuntou que esta ferramenta presenta utilidades innovadoras como un dicionario de frecuencias que ten en conta o índice de dispersión, “co que nos achega resultados moito máis relevantes sobre a frecuencia do léxico”, enxalzou.
Tamén dixo que este recurso permite xa desde a última versión recoñecemento de formas con gheada ou a posibilidade de realizar estudos variados desde a perspectiva de xénero, tendo en conta o emprego da linguaxe inclusiva e atendendo á discriminación dos resultados en función do sexo do autor e/ou interlocutor e habilitando cruzamentos entre o sexo dun autor e o sexo dos personaxes.