Facebook confunde “grelo” con “clítoris” en castelán e “pussy” en inglés

O tradutor automático da rede social interpreta o Premio Grelo de Ouro como "clítoris de oro" e "pussy of gold". Recentemente, un obreiro palestino foi detido pola Policía de Israel como presunto terrorista por outro erro do algoritmo de Facebook. A compañía está traballando nun novo sistema que combina intelixencia artificial e redes neuronais.

Por Alberto Quian | Madrid | 03/12/2017 | Actualizada ás 22:00

Comparte esta noticia

Facebook pode fachendar de ser a maior rede social do mundo, unha das maiores empresas do planeta e unha das ferramentas máis influentes na sociedade actual, nos medios de comunicación e na política. Pero Facebook, malia ser un produto sostido por algúns dos mellores tecnólogos, enxeñeiros informáticos e programadores do mundo, ten un dos peores tradutores automáticos que existen na Rede actualmente. Basta ver como traduce a palabra «grelo» como «clítoris» en español e «pussy» en inglés («cona» en galego) para darse conta de que a intelixencia artificial de Facebook, cando menos no campo da tradución, ten moito que mellorar.

Grelos de Galicia
Grelos de Galicia | Fonte: grelosdegalicia.org

Avisados por varios usuarios de Facebook, GC comprobou que estaba traducindo así unha publicación de El Correo Gallego: "Entrega del XXX Grelo de Ouro" como "Entrega del xxx clítoris de oro" en español e "Delivery del xxx puyssy of gold" en inglés (os Premios Grelo de Ouro son entregados cada ano pola Fundación Amigos de Galicia).

Obviamente, El Correo Gallego nin ten culpa nin pode facer nada contra estas traducións —agás puntuala co valor máis baixo no sistema de avaliación por estrelas que ten este servizo—, como calqueroutro usuario desta rede que use estes ou outros termos que o tradutor é incapaz de identificar correctamente.

Facebook é o único responsable de ter activado un servizo de tradución tan penoso coma este, que confunde aos usuarios e que pode causar enormes agravios e prexuízos.

O grave é que, á marxe de determinadas anécdotas e das chanzas que poidan suscitar algunhas traducións erróneas, unha errada interpretación de Facebook pode danar a reputación dunha persoa, empresa ou marca, ou dar lugar a equívocos con consecuencias inimaxinables, como o que explicaremos máis adiante. Pero antes, imos coa parte graciosa do asunto.

Facebook confunde “grelo” con “clítoris” en español e “pussy” en inglés.
Facebook confunde “grelo” con “clítoris” en español e “pussy” en inglés.

CANDO GOOGLE ANUNCIOU A "FEIRA DO CLÍTORIS"

mutación do grelo en órgano eréctil non é un fenómeno novo. O caso de Facebook é aínda máis chamativo polo feito de que este mesmo erro de tradución xa o cometeu (e padeceu) Google hai dous anos e pasou a corrixilo logo de que se xerase unha onda de chanzas en Internet coa súa tradución de «grelo» como «clítoris».

En outubro de 2015, os veciños das Pontes vían con sorpresa como a súa tradicional Feira do Grelo transmutara na "Feria do Clítoris" no mundo Google.

O 31 de outubro de 2015, La Voz de Galicia publicaba unha nova que se faría viral na Rede: "Cuando «o grelo» se convierte en «el clítoris»". No texto dábase conta da sorpresa que levaran os veciños das Pontes cando viron que a súa tradicional Feira do Grelo transmutara na "Feria do Clítoris" no mundo Google. Así aparecía, por obra e graza do tradutor automático da compañía estadounidense, na páxina web do Concello pontés.

O indixerible texto, traducido ao castelán, era o seguinte: "El clítoris es uno de los productos típicos de la cocina gallega. En Puentes homenaxéaselle desde 1981, todos los domingos de Carnaval, con rapini, Feria que, con el patrocinio del Consejo de Puentes, de apoyo a los agricultores de la región, hace del clítoris uno de los productos estrella de la gastronomía local".

Días despois, medios de todo o mundo facíanse eco desta nova, transformada en chanza global. Como se dicía na propia Voz de Galicia, o "Clitoris Festival" arrasaba na Rede.  

A confusión parece deberse a que en Brasil a palabra «grelo» acostuma asociarse co clítoris (Google ofrece centos de páxinas de sexo que chaman a gozar do grelo feminino) e tamén á asimilación que Google facía do galego co portugués. O erro foi corrixido por Google e os seus algoritmos.

Porén, para Facebook os grelos seguen sendo parte do aparato xenital feminino. O tradutor automático desta rede social é unha fraude en toda regra que non admite escusas dunha empresa cuxas cifras monetarias son milmillonarias e que fachenda de estar á vangarda tecnolóxica, incluída a intelixencia artificial. Porque os seus erros poden causar danos irreparables nalgúns casos.

UN SAÚDO AFECTUOSO CONFUNDIDO CUNHA AMEAZA TERRORISTA

Un caso recente que demostra como Facebook lle pode arruinar a vida a alguén por un mal algoritmo ocorreu recentemente en Israel. Alí, a Policía detivo o pasado outubro a un inocente cidadán palestino ao que confundiu cun perigoso terrorista por facerlle caso a Facebook. O tradutor desta empresa de redes sociais mudara un simple e afectuoso saúdo de bos días nunha ameaza terrorista.

O algoritmo de Facebook traduciu un "Bos días" en árabe dun usuario palestino nun "Atacádeos" en hebreo e "Facédelles dano" en inglés. 

O 22 de oubro pasado, o xornal israelí Haaretz informaba de que a Policía de Israel arrestara a un home na franxa de Cisxordania tras divisar o que parecía, segundo o tradutor de Facebook, unha ameaza terrorista en toda regra. O home, árabe, é un traballador da construción que aparecía en Facebook fumando un cigarro e sostendo o que parece un café, apoiado sobre unha escavadora nunha obra. A súa mensaxe, a típica dos millóns de usuarios de redes que fan transparentes as súas vidas privadas: "Bos días". Pero o algoritmo do tradutor de Facebook, aínda máis ignaro do árabe que do galego, decidiu traducir o saúdo do obreiro nun "Atacádeos" en hebreo e "Facédelles dano" en inglés (“Hurt them"). 

Unha broma algorítmica que lle custou a este home horas de calabozo e interrogatorios antes de ser liberado. Os axentes israelís confiaron máis nun algoritmo computacional que na sapiencia humana: non consultaron a ningún tradutor de árabe. 

Falantes de árabe explicaron ao xornal Haaretz que a transliteración en inglés utilizada por Facebook non é unha palabra actual do árabe, pero podería parecerse ao verbo "ferir", aínda que, como se evidenciou, calquera falante árabe podería ver claramente que a transliteración non coincidía coa tradución.

Amais, a Policía fixo as súas propias elucubracións —sen algoritmos— e relacionou a falsa tradución coa orixe árabe do obreiro e a escavadora, para determinar que era un posible terrorista. A escavadora é un vehículo que se usou no pasado en atentados terroristas, polo que sospeitaron que ameazaba con levar a cabo un ataque así.

Un feito que compromete aínda máis o rendemento da intelixencia artificial de Facebook, tamén moi cuestionada ultimamente polo auxe das noticias falsas nesta rede social.

FACEBOOK PROMETE MÁIS INTELIXENCIA ARTIFICIAL

Este mesmo ano, Facebook anunciou que pronto as súas traducións serían moito máis rápidas e mellores, grazas ao traballo feito no Facebook A.I. Research (FAIR), departamento dedicado ao desenvolvemento de intelixencia artificial.

Facebook anunciou que xa concluíu o seu movemento á tradución automática neuronal, a cal permite que os sistemas traballen dun xeito similar ao cerebro humano.

Facebook A.I. Research (FAIR) anunciou que o uso combinado de intelixencia artificial e redes neuronais prometen resultados cando menos nove veces mellores que os dos seus competidores na tradución de contidos en liña, tanto escritos como audiovisuais.

En agosto deste ano, Facebook anunciou que xa concluíra o seu movemento á tradución automática neuronal, é dicir, os contidos son traducidos grazas a redes neuronais convolucionais (CNN) e redes neuronais recorrentes (RNN), que permiten que os sistemas traballen dun xeito similar ao cerebro humano.

O novo sistema, entre outras cousas, melloraría substancialmente as conversas máis informais, nas que os tradutores automáticos teñen máis dificultades de interpretación. A diferenza doutros sistemas clásicos,  este non realiza traducións de forma lineal, senón que toma o bloque de texto e o vai analizando por partes de maneira simultánea, facilitando un proceso máis rápido, comparando os resultados e axustándoos de acordo aos contextos atopados en cada unha das partes analizadas.

Os sistemas usados até agora, baseados en frases clave, traducen oracións e logo determinan probabilísticamente a tradución final. Cos modelos neuronais lévase o proceso a un nivel superior de abstracción, no que a interpretación dunha oración se converte en parte dunha representación vectorial multidimensional, apoiando a tradución no contexto.

NOVAS ACHEGAS CIENTÍFICAS

Máis recentemente, a prestixiosa revista Science publicaba un artigo sobre como a intelixencia artificial se está volvendo bilingüe, sen dicionario ou intervención humana.

A tradución automática da linguaxe percorreu un longo camiño grazas ás redes neuronais, algoritmos informáticos que se inspiran no cerebro humano. Pero a capacitación de tales redes require unha enorme cantidade de datos: millóns de traducións, frase a frase, para demostrar como o faría un ser humano. Agora, dous novos traballos científicos mostran que as redes neuronais poden aprender a traducir sen textos paralelos, o que para os expertos é un avance sorprendente que podería facer que os documentos en moitos idiomas sexan máis accesibles.

Un deses novos traballos foi desenvolvido en España, na Universidade do País Vasco, liderado polo informático Mikel Artetxe.

"Imaxine que lle dá a unha persoa moitos libros chineses e moitos libros en árabe —ningún deles se superpón— e a persoa ten que aprender a traducir o chinés ao árabe. Iso parece imposible, verdade? Pois demostramos que unha computadora pode facer iso", explica Artetxe en Science.

Como explica o xornalista científico Matthew Hutson, a maioría das aprendizaxes automáticas —nas que as redes neuronais e outros algoritmos informáticos aprenden da experiencia— son "supervisadas". Unha computadora adiviña, recibe a resposta correcta e axusta o seu proceso en consecuencia. Iso funciona ben cando se ensina a unha computadora a traducir, por exemplo, inglés e francés, porque existen moitos documentos en ambos os idiomas. Pero non funciona tan ben para idiomas raros ou populares sen moitos textos paralelos.

O outro sistema, creado polo científico informático de Facebook Guillaume Lample, con sede en París, e os seus colaboradores, agrega un paso adicional durante a tradución. Ambos os sistemas codifican unha oración dun idioma nunha representación máis abstracta antes de decodificarla no outro idioma, pero o sistema de Facebook verifica que a "linguaxe" intermedia é verdadeiramente abstracta.

"Acabamos de abrir unha nova vía de investigación, polo que non sabemos onde nos diriximos", din os científicos.

Os dous novos traballos céntranse na aprendizaxe automática non supervisada. Cada sistema constrúe dicionarios bilingües sen a axuda dun mestre humano que lles diga cando as súas suposicións son correctas. Iso é posible porque os idiomas teñen unha gran similitude na forma na que as palabras se agrupan entre si. As palabras para «mesa» e «cadeira», por exemplo, úsanse a miúdo xuntas en todos os idiomas. Entón, avanza Hutson, se unha computadora mapea estas co-ocorrencias como un atlas xigante con palabras para cidades, os mapas para diferentes idiomas pareceranse os uns aos outros, só con diferentes nomes. Unha computadora pode entón atopar a mellor maneira de superpoñer un atlas noutro e conséguese así un dicionario bilingüe.

Os novos documentos, que usan métodos notablemente similares, tamén se poden traducir ao nivel da oración. Ambos usan dúas estratexias de adestramento, chamadas tradución inversa e eliminación de ruído. Xuntos, estes métodos ensinan ás redes a estrutura máis profunda da linguaxe. 

Hutson remarca que tanto Artetxe como Lample din que poderían mellorar os seus resultados aplicando técnicas do outro. O certo é que nos únicos resultados directamente comparables entre os dous experimentos —traducindo texto inglés e francés do mesmo conxunto duns 30 millóns de oracións— ambos os dous informáticos lograron no método de avaliación Bilingual Evaluation Understudy (utilizado para medir a precisión das traducións) unha puntuación de aproximadamente 15 en ambas as direccións, un resultado que, como salienta Hutson, non é tan alto como o de Google Translate, un método supervisado que acada uns 40, ou os resultados acadados por tradutores humanos, que poden obter máis de 50 puntos, pero é mellor que a tradución palabra por palabra.

Con todo, os autores asumen que os sistemas poderían mellorarse facilmente se se fan semisupervisados, engadindo unhas mil oracións paralelas ao seu adestramento. Ademais de traducir entre idiomas sen moitos textos paralelos, tanto Artetxe como Lample din que os seus sistemas poderían axudar a emparellar pares como inglés e francés se os textos paralelos son do mesmo tipo, como informacións nun xornal, pero queren traducir novos dominios, como a xerga rueira ou a linguaxe médica.

"Acabamos de abrir unha nova vía de investigación, polo que non sabemos onde nos diriximos", din os científicos computacionais en Science.

RESULTADOS "PROMETEDORES"

Con todo, a tradución automática neuronal non ofrece un proceso perfecto e os investigadores están a traballar en manter a comprensión e precisión da tradución en textos longos.

Facebook non é a única empresa que está desenvolvendo a tradución automática neuronal. Outros xigantes tecnolóxicos como Google e Microsoft tamén anunciaron que se están a centrar no uso combinado de intelixencia artificial e redes neuronais. Pero Facebook foi o primeiro en facer públicos os primeiros resultados "prometedores" nunha investigación que foi publicada en maio pasado.

No entanto, o tradutor de Facebook levou ao calabozo durante unhas horas a un home palestino que o algoritmo confundiu cun potencial terrorista, e segue dándolle sabor a sexo aos grelos.

Comparte esta noticia
¿Gústache esta noticia?
Colabora para que sexan moitas máis activando GCplus
Que é GC plus? Achegas    icona Paypal icona VISA
Comenta
Comentarios 4 comentarios

3 avelino

E logo, esta é a causa das versións en galego do Faro e da Voz?

2 mariano rajuelas o iluminatis

A POLLA RECORD (e non me refiro o galiñaceo en cuestión) sinon o órgano viril ... o face esta moi mal, moita censura, moita inquina contra os de esquerdas, os de autenticas esquerda non socialato non podreiros nin anovados nin mareados nin esquerda la unitaria, sinon os nacionalistas galegos, en verdade o grandioso presidente ZUKEMBERG non se entera do que están facendo no seu nome os seus empregados, cheira a moita dictadura e intromisión do gobernó pepeiro, teñen autenticos trolles de expaña do cni fabricando cousas raras e xornais decindo que expaña esta ben cada 5 minutos din que subiu o índice de tocalo o órgano euxenesico, e que polo tanto imos todos cun priapismo rampante polo medio das ruas e sin necesidade de untarse en viagras subidoras do índice, e non quero decir o dos OVOS que tampouco son da gallinácea precisamente...

1 Pondaliao

Porque o traducen do portugués, que é como vulgarmente se dí clitoris.O galego ten excasa presencia na rede, e cando buscas unha traducción remite ao portugués.

1 Anonymous

Se les a reportaxe, xa o explican no texto. O grave do asunto é que cos (supostos) avances en intelixencia artificial e esas redes neuronais das que falan o tradutor automático de Facebook non comprenda o idioma no que se está escribindo nin o contexto e confunda o grelo coa cona.