Universidade de Vigo

Un estudo advirte que o galego é a lingua cooficial cun menor desenvolvemento de tecnoloxía lingüística

O proxecto European Language Equality (ELE), que mide e analiza o emprego das tecnoloxías lingüísticas dos idiomas europeos, vén de concluír que o galego está á cola en canto a recursos e aplicacións respecto ao resto de linguas oficiais do estado. O proxecto está financiado pola Unión Europea e a Universidade de Vigo forma parte do consorcio ao que están adheridos un total de 52 universidades, consorcios e empresas de Europa. A catedrática Carmen García Mateo e o investigador José Manuel Ramínez Sánchez, do Grupo de Tecnoloxías Multimedia (GTM) do Centro de Investigación en Tecnoloxías de Telecomunicación (atlanTTic) da Universidade de Vigo, foron os encargados de analizar a situación en canto a recursos, servizos e comunidades de falantes do galego. “O obxectivo de ELE é analizar a adaptación tecnolóxica dos idiomas de Europa co fin de que exista plena igualdade lingüística dixital en 2030. Agora, hai que facer unha folla de ruta para mudar esta situación. Hai moita marxe na que traballar”, subliña Carmen García Mateo, coordinadora do grupo de investigación de atlanTTic. Como conclusión xeral, segundo o informe presentado polos investigadores do centro de investigación da Universidade de Vigo, “hai poucas aplicacións de síntese de voz, recoñecemento de voz, corrección ortográfica e gramatical e tradución automáticas; polo tanto, un baleiro importante en canto a recursos multimedia adecuados para desenvolver aplicacións tan importantes no mundo actual como os axentes conversacionais por voz de última xeración”.

Pola contra, o galego, segundo o informe, “si ten boa presenza en bases de datos de texto de gran dimensión calidade, e as tecnoloxías e os servizos baseados en texto están nunha fase máis madura”.

No conxunto do Estado, os datos recompilados amosan unha brecha considerable en comparación con outras linguas con maior número de falantes, pero tamén coas outras linguas cooficiais do estado español (catalán e éuscaro). “Esta diferenza é crítica en canto a recursos e servizos relacionados con datos de tipo multimedia ou do ámbito da saúde, pois os existentes son pobres en diversidade e pequenos en tamaño”, sinala o estudo. O maior perigo a curto prazo é que, de non reverterse esta situación, o galego quede fóra da revolución que o Big Data e a intelixencia artificial está a provocar en moitos sectores estratéxicos pola falta de recursos para aplicar estas tecnoloxías.

Como exemplo positivo, o informe apunta o sitio web da Radio Televisión de Galicia pola produción de contidos multimedia. Tamén hai un número crecente de diarios locais dixitais escritos en galego. Aínda que algunas plataformas como Facebook ou Youtube, ou grandes empresas de software como Microsoft ou Apple ofrecen unha versión con sorporte para o galego nas súas interfaces, moitas outras como TikTok, Twitch ou Adobe, utilizano en beta ou con menor apoio como o caso de Twitter. Tamén se produce unha falla extrema de apoio ao galego nos asistentes virtuais como Alexa, Siri, Google Assistant ou Cortana. Nos últimos anos, continúa o informe, desenvolvéronse unha serie de produtos e servizos destinados á incorporación do galego nas TIC. Exemplos interesantes son o portal da Real Academia Galega, o tradutor Gaio ou o sitio web do Goberno galego.

O punto forte: unha experimentada comunidade investigadora en Galicia

Segundo a docente da Escola de Enxeñaría de Telecomunicación, Carmen García Mateo, “nesa marxe para mudar esta situación en termos obxectivos, favorécenos a existencia dunha experimentada comunidade investigadora en Galicia en áreas como o recoñecemento automático da fala, a síntese de voz ou o procesamento de linguaxe natural e, por suposto, en áreas humanísticas como a filoloxía ou a lingüística”. A actual colaboración interdisciplinar dos investigadores de atlanTTic xunto cos docentes da Facultade de Filoloxía e Tradución da Universidade de Vigo axuda a mudar esta situación. “Estamos a desenvolver xa ferramentas e recursos lingüísticos. Esta alianza é, en gran medida, a responsable nos últimos catro anos dun aumento considerable da produción de recursos e servizos de calidade para a lingua galega”. Os investigadores tamén salientan no informe a propia estratexia posta en marcha pola Xunta de Galicia.

“Doutra banda, observamos unha tendencia nas grandes empresas do sector consistente en reducir os seus esforzos en desenvolver tecnoloxías específicas para linguas minoritarias como o galego”. Tamén advirten da falta de interese de interese polas linguas cooficiais en xeral nalgunhas estratexias nacionais relacionadas coas tecnoloxías do fala como na Estratexia do Procesamento da Linguaxe Natural 2020 ou a Estratexia Nacional de Intelixencia Artificial 2020.

Propostas de mellora

Como propostas de mellora, os investigadores de atlanTTic recomendan, en primeiro lugar, “a creación dunha oficina pública que custodie de maneira centralizada e estandarizada todos os recursos desenvolvidos para a lingua galega xa que, na actualidade, atópanse diseminados en páxinas web ou en servidores internos dos desenvolvedores facendo complexa a súa procura”. En segundo lugar, segundo os investigadores “é necesario investir na creación de bases de datos de recursos lingüísticos de calidade e gran tamaño con contido multimedia, dígase gravacións de audio ou vídeo, que cubran as distintas variantes e estilos da lingua falada no territorio galego”. En terceiro lugar, “apoiar a produción científica e a transferencia tecnolóxica baseada en tecnoloxías da fala e a linguaxe para que o galego gañe presenza en solucións comerciais e sexa considerado como un nicho de mercado de interese”.

En canto ás comunidades de falantes “cremos indispensable que consuman e produzan contidos en galego; pero tamén que esixan soporte para o galego naqueles servizos e produtos que consomen regularmente (plataformas de contidos, medios dixitais, aplicacións móbiles ou de escritorio, sistemas operativos, etc.)”.