La evolución de los traductores automáticos gracias a las redes neuronales

0
393
Sundar Pichai, CEO de Google, brindó datos del crecimiento de su traductor (Reuters) CEO Sundar Pichai speaks during the presentation of new Google hardware in San Francisco, California, U.S. October 4, 2016. REUTERS/Beck Diefenbach

El traductor de Google traduce 143 mil millones de palabras por día, informó el CEO de la compañía, Sundar Pichai, la semana pasada. Asimismo, según Business Insiderel director ejecutivo señaló que, durante la Copa del Mundo en Rusia, detectaron un incremento en el uso de esa herramienta lanzada en 2006, que traduce más de 100 idiomas.

La app Traductor de Google es gratuita y no tiene publicidad. Para Android, existe desde 2010 y para iOS, desde 2011. En sus inicios, el gigante tecnológico innovó en traducción automática estadística (SMT, por sus siglas en inglés) a gran escala.

El traductor de Google es usado por 500 millones de personas por día.

El traductor de Google es usado por 500 millones de personas por día.

En 2016, presentó Neural Machine Translation (NMT), un sistema de aprendizaje automático de punta a punta. Procesa la información a través de redes neuronales (neuronas artificiales que imitan el funcionamiento del cerebro humano).

La inversión de Google en su traductor es permanente. Inclusive, durante la conferencia anual Google Cloud Next 2018, que culminó hace unos días en San Francisco, la compañía anunció el desarrollo de AutoML Translation, una solución de machine learning que funciona para 27 idiomas y permite mejorar la capacidad de interpretación del traductor.

Tipos de traducción

En el caso de SMT, los resultados se basan en modelos estadísticos. Este sistema trabaja con enfoques basados ​​en reglas para la traducción automática. Puede usar ejemplos de oraciones de dos lenguas y determina los parámetros del sistema de estadísticas que permite realizar la traducción.

El NMT es el sistema de redes neuronales y puede traducir oraciones enteras al mismo tiempo. El resultado funciona como contexto y permite dar con la traducción más relevante. En este modelo de traducción, el sistema aprende con el tiempo a crear traducciones más naturales.

«Este tipo de sistema utiliza la llamada ´red neuronal profunda´ que le permite aprender a reconocer patrones y estructuras en las oraciones. Esto hace que la gramática de la oración traducida suene de manera más amena y similar al uso cotidiano de ese idioma», señala a Infobae Matías Fuentes, Responsable de Comunicación de Producto de Google Argentina.

Luego explica que la compañía no solo trabaja en la mejora continua de la herramienta a través de su equipo de ingenieros y especialistas. También, desde julio de 2014, existe la Comunidad Traductora de Google. Es una platafoma donde entusiastas de los idiomas en todo el mundo pueden realizar contribuciones para lograr traducciones más naturales.

Comunidad del Traductor de Google, plataforma colaborativa para que los usuarios contribuyan a la mejora del servicio.

Comunidad del Traductor de Google, plataforma colaborativa para que los usuarios contribuyan a la mejora del servicio.

Qué hay que mejorar

Según «Six Challenges for Neural Machine Translation» (6 desafíos de la traducción automática neuronal), documento de la Universidad Johns Hopkins, hay que trabajar en diversos caminos para la mejora de los traductores automáticos. Por ejemplo, en la importancia del dominio de las «palabras raras» (como un modismo) y las oraciones largas.

De acuerdo a esta investigación, los sistemas neuronales tienen una curva de aprendizaje más pronunciada con respecto a la cantidad de datos de entrenamiento. Esto puede provocar una calidad pobre de las traducciones en entornos de bajos recursos (con baja cantidad de material en el sistema), pero un mejor rendimiento en configuraciones con altos recursos.

Por otro lado, destaca que los sistemas NMT y SMT continúan teniendo dificultades, casi por igual, para traducir algunas palabras infrecuentes (o raras).

¿Traductor público Vs traductor automático?

«La traducción automática tiene su evolución histórica. Quien comenzó fue IBM y luego siguió Google. Sin embargo, el proceso del lenguaje humano tiene un componente mental que hasta ahora no ha sido superado por posibilidades tecnológicas», señala a Infobaela Traductora Pública Cecilia Irrazábal, profesora en la Universidad del Museo Social Argentino (UMSA).

Continúa: «La traducción recepta los desafíos del mundo globalizado y también los hace propios. Es así como hoy día se integran los motores de traducción automática con las herramientas de traducción asistida, a fin de mejorar la práctica profesional, de tal suerte que se aumenta la productividad y, por ende, se generan más ingresos».

Por su parte, la Traductora Pública Clarisa Cajiau, explica: «Los traductores automáticos no repercuten por el momento en la traducción pública. Creo que, porque las empresas son conscientes de lo poco confiables que son y no se atreverían a confiarle un contrato a un traductor automático».

Cajiau asegura que, donde más se usa esta herramienta es en las traducciones no públicas, sobre todo en el ámbito comercial, con folletos, o empresas de ecommerce que traducen los nuevos productos que publican.

La versión paga del traductor de Google es Api Translate. La usan muchas compañías para potenciar el uso de herramientas web y para traducir contenido de sitios. En el caso de Cajiau, uno de sus trabajos es editar los resultados del traductor automático.

En este sentido, expresa: «Reducen costos al pagar por una edición en lugar de una traducción. El tiempo del traductor no se reduce, en la mayoría de los casos tenemos que borrar lo que hizo el traductor automático y volver a traducirlo. Aunque han mejorado algo, los traductores automáticos tienen problemas para entender contextos o vocablos de una región o tema en particular, especialmente algo que sea muy técnico«.

Finaliza: «Me sucede cuando recibo para traducir al español manuales de empresas chinas que fueron pasados al inglés por una máquina. El resultado es lo que llamamos ´chinglish´. En esos casos, más que traducir, debemos hacer todo un trabajo de investigación e interpretación y perdemos muchísimo tiempo».

Otros traductores

El traductor de Google es una herramienta que evoluciona año tras año, y es masiva. Pero no es la única. Existen otras opciones similares, ¿cuáles?

Word Reference

Es un diccionario con foco en inglés. El sitio web cuenta con foros con más de 2 millones de entradas, en donde los usuarios registrados pueden preguntar y responder consultas vinculadas a gramática y vocabulario.

DeepL

Los creadores del diccionario Linguee desarrollaron DeepL.

Los creadores del diccionario Linguee desarrollaron DeepL.

De origen alemán, es una solución creada por la empresa creadora de Linguee, diccionario on line. El sitio web DeepL es un traductor con inteligencia artificial que, aseguran, puede procesar un millón de palabras en menos de un segundo.

Jisho.org 

Es un diccionario japonés-inglés. Al ingresar una palabra u oración en el buscador, la herramienta proporcionará una gran cantidad de datos útiles para comprender mejor el idioma nipón.

Incluye una herramienta para dibujar e interpreta el manuscrito, para que el usuario aprenda también la escritura japonesa.

Triplingo

Es una opción indicada para viajes. La app brinda traducciones instantáneas en 42 idiomas. Incluye datos sobre costumbres de cada destino visitado, por ejemplo. Es una herramienta freemium, ya que es de descarga gratuita pero tiene una versión paga, que incluye clases de idiomas y traducción en vivo, entre otras funciones.

Fuente: Infobae

Dejar respuesta

Please enter your comment!
Please enter your name here