Redada

Redada nº 19


redada redadas anteriores i+d da periferia á Rede contacta artigos e relatorios ligazóns
As industrias da lingua en Galicia: Eppure si muove (II)

(1 de febreiro de 2002) 

Dedicabamos a Redada anterior a subliñar a importancia estratéxica para o noso idioma de contar cunhas industrias da lingua propias, e comezabamos un percorrido descritivo e reflexivo polas achegas que neste eido existen ou se están a desenvolver para o galego, partindo pola investigación lingüística básica. Como anunciabamos xa daquela, imos dedicar a presente Redada ós productos finales que chegan aos usuarios que -en principio- as empresas desenvolven como aplicación da anterior investigación básica, o que son as verdadeiras industrias da lingua, dentro do panorama do noso país e da nosa lingua. Imos seguir outra volta a José Antonio Millán na relación que establece destes productos (1).

Módulos orientados a tarefas

En xeral, son compoñentes que adoitan estar incorporados ós productos finais que chegan aos usuarios, aínda que non é este o caso maioritario para a nosa lingua.

Os primeiros correctores para o galego desenvolveunos en 1996 unha empresa de Lugo Allegue S.A., a partir do Vocabulario Ortográfico da Lingua Galega (VOLGA) elaborado polo Instituto da Lingua Galega (ILG). Permitían unha corrección exclusivamente ortográfica e sempre posterior á elaboración do texto, pois en realidade o corrector non se incorporaba ao software, senón que se trataba de aplicacións de tipo macro para procesadores de texto como certas versións do Word de Microsoft ou do WordPerfect. Esta foi tamén a característica senlleira doutros correctores desenvolvidos posteriormente: o Corrixe, desenvolvido polo propio ILG e co apoio da Dirección Xeral de Política Lingüística; o Bemposto, da man de item:)aga, e os desenvolvidos pola empresa Imaxín, os correctores Galgo, para a DXPL, e Cumio, para Edicións do Cumio, ligado ao seu diccionario electrónico.

Foi tamén esta última empresa a que desenvolveu, co apoio da Xunta de Galicia, o primeiro corrector de galego integrado nun paquete ofimático, o OfficeXP, que reúne algúns dos programas máis estendidos entre os usuarios (Microsoft Word, Excel, Power Point e FrontPage), o cal permite a revisión mentres se escribe. Ademais, permite a incorporación de diccionarios personalizados.

A progresiva mellora destes productos permite non só a corrección estrictamente ortográfica, senón tamén nalgúns casos a gramatical, e o que é máis importante para as características sociolingüísticas do noso idioma, unha que poderiamos denominar normalizadora, no caso do Galgo: a localización de castelanismos e outras desviacións da lingua padrón máis frecuentes e a posibilidade da súa substitución pola forma máis correcta (así, para *plantexar o Galgo suxire expor, formular, admitir, bosquexar, etc.). Cómpre afondar, non obstante, nas tarefas de corrección gramatical (por exemplo, o uso de tempos compostos como *había dito ou a falta de concordancia de xénero, como en *o orde, etc.), e estilística, de xeito que facilita a lexibilidade do texto.

Os traductores automáticos producen versións dun texto en linguas diferentes á do texto de partida. O primeiro proxecto de traductor automático español-galego do que se tivo noticia, foi o do proxecto Es-Ga, desenvolvido no Centro Ramón Piñeiro dende os comezos deste, baixo a dirección de Guillermo Rojo. A diferencia doutros programas de traducción automática, que fan unha traducción palabra a palabra, o Es-Ga utiliza técnicas de enxeñería lingüística que consideran toda a oración castelá no seu conxunto, facendo unha análise morfolóxica, sintáctica e semántica para poder vertela ao galego nunha versión axeitada. O proxecto era unha colaboración do CIRP coa empresa catalana INCYTA (Ingeniería, Consultoría y Traducción Automática), dedicada á enxeñería lingüística, que desenvolvera un sistema de traducción automática castelán-catalán-castelán, adquirido pola Generalitat de Cataluña.

Sen embargo, o primeiro traductor automático galego-castelán-galego que estivo á disposición dos usuarios da Rede foi o Rianxo, desenvolvido por un informático arxentino descendente de galegos, Roberto Abalde. De tal producto, e froito tamén da colaboración desinteresada doutros enredados galegos, saíron dende 1998 varias versións progresivamente melloradas ata a 0.5. Trátase dun traductor básico, que conta con 4029 verbos, 7628 substantivos, 1024 adxectivos e 208 nomes propios, para utilizar ou non en liña, pero sempre introducindo os textos no programa.

Posteriormente outro galego da diáspora, André Ventas, desenvolveu o Taiga, coa característica de verter os textos á normativa de mínimos. Traduce arquivos de Word, ficheiros de texto, páxinas Web e texto tecleado, e permite o uso de dicionários persoais e temáticos. E finalmente, a empresa con sede en Santiago Dimensiona presentou publicamente en decembro de 2001 o Traduza-G, dispoñible para case todas as plataformas, rápido (traduce unha edición de El País en 10 minutos), e respectuoso cos formatos de edición. Ademais, amosa unha gran capacidade de adaptación aos usuarios: pódese incorporar a diversos sistemas de redacción e producción de documentación e personalizar escollas normativas, e presenta tres opcións de uso segundo o volume de traballo e o sistema.

Polas mesmas datas, máis ou menos, facíase por fin a presentación pública do Es-Ga do Centro Ramón Piñeiro, ao cal nos referiamos antes. Este traductor, o máis perfeccionado dende o punto de vista lingüístico e de calidade da traducción, corre en plataformas UNIX, o que lle resta accesibilidade para os usuarios. Parece ser que ata agora só está dispoñible para o uso de balde dos servicios da Xunta de Galicia (2), e que é a empresa catalana INCYTA, agora adquirida pola alemana Sail Labs (3), quen está a comercializar o dito producto.

No que se refire a ferramentas orientadas á lingua oral, cómpre volver referirnos ao Centro Ramón Piñeiro, que tamén desde os seus comezos incorpora o proxecto dun sintetizador texto-fala baixo a dirección de Manolo González. Trátase dun traballo interdisciplinar no que traballan enxeñeiros de telecomunicacións da Universidade de Vigo e lingüistas do CIRP. A ferramenta permite que un sistema automático converta en fala sintética un texto escrito, e logo de implementar unha primeira versión, na actualidade trabállase en mellorar a naturalidade do conversor e en dotalo doutras opcións.

Tamén Telefónica Investigación y Desarrollo andou a traballar nesta área hai uns anos, para desenvolver un sistema de recoñecemento da voz que servise para todas as linguas do Estado. Para o caso galego botaron man do traballo do ILG, e do seu arquivo de gravacións orais, que recolle toda a riqueza da fala galega. Sen embargo, para as novas fases deste proxecto (sistemas de verificación da identidade do locutor por GSM por medio da voz, que funcione tamén na rede móbil dixital), só se contempla a implementación para o español e o catalán.

Productos finais

Polo que respecta á existencia de sistemas operativos e procesadores de texto no noso idioma, cómpre lembrar as condicións case monopolísticas dun mercado dominado polo xigante Microsoft, ao cal, ata agora, non parece terlle interesado achegar os seus productos ao galego: nin se lle presenta esa necesidade (polo que opta polo mercado común do español) nin a Xunta de Galicia lle ofreceu á empresa de Bill Gates as vantaxes que atopou en Cataluña ou Euscadi (4).

Xa que logo, é no terreo do software de libre distribución onde existen iniciativas neste sentido, como a adaptación ao galego do sistema Linux, levada adiante polo Proxecto Trasno -un grupo dentro do software libre-, doutros programas utilizados na navegación por Internet ou o desenvolvemento dunha macro para galeguizar os menús do procesador de textos Microsoft Word, por parte da asociación sen ánimo de lucro galego21.net.

Polo que respecta a productos destinados ao ensino do galego, cómpre sinalar que o primeiro curso ofrecido a través da Rede foi o do proxecto Rábade, obra tamén do galego-arxentino Roberto Abalde e de numerosos colaboradores; sen embargo, non se trataba dun producto que incorporase ningunha técnica de enxeñería lingüística nin interactividade. O mesmo lle pasa a A palabra herdada, un curso de galego que atende a aspectos orais (con arquivos en formato MP3) e á escrita (en formato Adobe), editado para a DXPL por Citania de Publicacións S.L (5). Será Galingua, o primeiro método para aprendizaxe do galego partindo do nivel cero de coñecementos, aparecido en 2001, primeiro en cd-rom e dispoñible logo a través da Web, o que incorpore interactividade e ferramentas de corrección da expresión, lexicográficas, etc. Finalmente, E-galego é un proxecto do Instituto da Lingua Galega, Eido Media e o propio CESGA, para desenvolver un curso multimedia de galego para a Web e en cd-rom, dirixido a hispanofalantes, cun nivel intermedio (6), que contará cun avanzado sistema de avaliación e seguimento do progreso.

Por outra banda, a Rede Galega de Información e Documentación Xuvenil (RIX), dependente da Consellería de Muller, Xuventude e Familia, puxo en liña un Curso de Inglés Interactivo, dende o castelán e dende o galego, curso incompleto ao que, por certo, só se pode acceder co Explorer de Microsoft sen que en ningún lugar se advirta da cuestión, circunstancia habitual en todos os contidos desenvolvidos dende e para a Xunta de Galicia.

Valoración: Eppure si muove

Aínda que poida semellarnos case ciencia-ficción, non ha tardar o día, cando menos no primeiro mundo ao que semella pertencermos, en que vexamos a nosa vida cotiá invadida pola demótica, en que os aparellos electrodomésticos e os sistemas de información e comunicación que manexemos os poidamos dominar a través da voz, e eles falen connosco. Por outra banda, cada vez vai ser máis complicado buscar algo no maremagnum de datos de todo tipo que nos fornezan os novos medios, e a información, a comunicación e as trasaccións vanse realizar nunha babel idiomática e cultural. Resulta vital que o galego poida estar á altura dos novos tempos, e, daquela, que se incentive a investigación e o desenvolvemento progresivo de productos que respondan ás necesidades que se aveciñan. Onda non, verémonos obrigados a seguir o camiño do que vimos denominando espacio común, o do castelán, para calquera pequena actividade cotiá.

Comezamos a dispoñer xa dalgúns deles, en proceso continuado de mellora: correctores, traductores automáticos, conversores texto-voz, ferramentas de recoñecemento de voz, formación lingüística en soporte dixital, algún software... e coñecemos a existencia de investigacións e proxectos para desenvolver outros (7). Sen embargo, cómpre darlles máis pulo a moitos deles e comezar a traballar xa noutro tipo de productos que faciliten os intercambios con outros idiomas, as buscas intelixentes, a edición, etc.: indexadores, resumidores de documentos, buscadores, asistentes terminolóxicos, xestores e analizadores de información...

Cómpre, por outra banda, avaliar a realidade actual das industrias da lingua en Galicia, e analizar os activos e os pasivos con que contamos, no que se refire aos productos en si, aos axentes de diverso tipo e responsabilidade, e ás políticas implementadas. Tentaremos dar tres ou catro pinceladas superficiais neste senso, sen ánimo, nin moito menos de sermos exhaustivos, e séndomos conscientes de que estas son as primeiras pedras da obra.

Unha das eivas que apreciamos é a concentración arredor do binomio español-galego, tanto nos traballos de investigación lingüística previos coma nos productos finais. Aínda que é indubidable que o maior contacto lingüístico e a fonte principal de conflicto é co castelán, o certo é que o presente nos amosa xa unha realidade cada vez máis plurilingüe, na que o inglés semella ser unha especie de lingua franca. Sen embargo, a producción de diccionarios (8), de repertorios terminolóxicos, de traductores automáticos, ou de ferramentas de formación lingüística desenvolvidas ata agora non atenden nin a esa diversidade nin á preponderancia do inglés nos contidos. ¿Veremonos, logo, obrigados a pasar polo castelán como lingua intermedia ou final?

Por outra banda, no que se refire aos traductores automáticos, e logo de subliñar que todos eles traducen do español para o galego, permitímonos lanzar ao aire unha pregunta: estes traductores, ¿servirán unicamente para traducir contidos en español producidos fóra de Galicia, ou para perpetuar situacións aparentemente galeguizadas, pero que encobren unha realidade distinta? Queremos dicir: ¿el non servirán para que institucións e empresas galegas amosen unha faciana galeguizada, gracias a estas ferramentas informáticas, mentres que a realidade é que carecen dunha planificación lingüística axeitada, que fixe obxectivos e metas no uso do galego, e aplique medidas para logralos, como formación para o seu persoal, dotación de perfís lingüísticos, etc.?

Un axente con tanta responsabilidade como as institucións galegas semella que non están a cumprir o seu papel satisfactoriamente. Como sinalabamos na Redada anterior, non propician sinerxías que acheguen investigación, desenvolvemento, innovación; non facilitan o acceso a axudas económicas como as que poden vir da Unión Europea, e estanse a perder moitas oportunidades de negocio, de creación de emprego e para o idioma. Pero, sobre todo, non apostan por incentivar e consolidar un tecido de empresas do país que poida desenvolver unha industria da lingua galega. O proxecto do Ramón Piñeiro para desenvolver o Es-Ga encagóuselle a unha empresa catalana, que, agora, absorbida por outra alemana, tentará tirarlle rendemento a un investimento público galego. Para desenvolver o conversor texto-fala, sen embargo, o mesmo centro prescindiu da colaboración con empresa ningunha, e botouse man exclusivamente de profesores universitarios e bolseiros; o mesmo ocorreu con Galingua, desenvolvido dentro do Departamento de Informática da Universidade de Vigo. Semella que noutros casos en que si colaboraron con empresas galegas, foron estas as que presentaron os proxectos, ficando o papel institucional limitado a financialos.

Sobre todo, a grande eiva no que atingue ás institucións, é -e perdoade a reiteración- a falta dunha política lingüística e dunha planificación estratéxica a curto, medio e longo prazo. Cremos que as iniciativas de investigación e de implementación de productos vistas nestas dúas últimas redadas, sendo basicamente positivas, responden, coma sempre, á improvisación, e non a unha necesidade derivada dunha planificación lingüística.

Finalmente, fronte ao papel dunha gran compañía como Telefónica, sempre beneficiada coa política comunicacional levada adiante pola Xunta de Galicia de Manuel Fraga, e que, sen embargo, non considera o noso idioma dentro da súa política de I+D (9), quixeramos sobrancear o esforzo desas pequenas empresas (por non falarmos de asociacións sen ánimo de lucro ou de persoas concretas) que desenvolveron productos de enxeñería lingüística, algúns de uso xa bastante estendido, outros que, sen dúbida acadarán o éxito, e que mesmo son capaces de competir noutros mercados (10). Pequenas empresas que non só son capaces de comezar a enfiar unha pequena industria neste eido, senón que demostran un claro compromiso para co noso idioma. De aí que nos felicitemos polo papel que están a xogar, retomando a Galileo: Eppure si muove.

_____________________

(1) Millán, J. A. (2001): Internet y el español, Madrid, Fundación Retevisión. Vid. páx. 129-132.

(2) Ignoramos se se vai facilitar o seu uso a outras administracións e institucións públicas.

(3) INCYTA foi adquirida en 2000 por Sail Labs, empresa con sede en Múnic dedicada ás tecnoloxías e productos relacionados coa comprensión, o procesamento e a traducción de linguas naturais, dentro das áreas de tecnoloxías da voz, da traducción e da análise intelixente de contidos (para buscar e extraer información de grandes volumes de datos, con resumos automáticos e clasificación por temas.

(4) É esta unha cuestión polémica, pois, por unha banda, Microsoft ten vantaxes abondas de seu (especialmente pola dominio practicamente total e monopolístico do mercado), como para que unha Administración pública lle ofreza aínda máis axuda, sobre todo cando non está a propiciar a existencia dun tecido empresarial propio neste eido. Por outra banda, contraponse a dura realidade, moi difícil de mudar: os productos de Microsoft son os utilizados maioritariamente polos galegos e galegas, e temos que facelo noutro idioma.

(5) Tamén está dispoñible dende Galicia digital.

(6) Xa que logo, semella unha ferramenta dirixida a facilitar o proceso de normalización para os castelanfalantes de Galicia, que para a aprendizaxe do galego como lingua estranxeira, algo absolutamente vital para o noso idioma.

(7) Por exemplo, os proxectos que está a levar adiante o Departamento de Lingüística Informática da Universidade de Vigo, algúns deles en colaboración coa empresa Imaxín.

(8) Ata o ano 2001, todos os diccionarios bilingües dispoñibles eran castelán-galego ou galego-castelán. En 2001 a editorial Xerais publicou un primeiro e pequeno Diccionario elemental inglés-galego, galego-inglés, da autoría de Benigno F. Salgado, cunhas 3.000 entradas.

(9) Claro que tamén debemos lembrar que os pasos que Telefónica deu a prol do galego, por exemplo, na emisión de facturas, na atención ao cliente, foron gracias á presión da sociedade galega. Sen embargo, nin sequera ofrece o seu web en galego, malia que hai máis de dous anos que levan traballando niso...

(10) Así, a empresa Imaxín desenvolveu para o Departamento de Normalización Lingüística do Goberno Vasco o primeiro diccionario en web inglés-eusquera, eusquera-inglés.

  

arriba

 

 

 

 

 

 

 

 

 

arriba

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

arriba

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

arriba

 

 

 

 

 

 

 

 

 

 

 

 

 

 

arriba

 

 

 

 

 

 

 

 

 

arriba

arriba

 

 

 

 

 

 

 

 

 

 

 

 

 

 

arriba

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

arriba

Subscríbase ás redadas

arriba