banner
Hogar / Noticias / Traducción automática: una guía completa
Noticias

Traducción automática: una guía completa

Jul 07, 2023Jul 07, 2023

La traducción automática es el uso de inteligencia artificial para traducir automáticamente texto y voz de un idioma a otro. Usando técnicas de procesamiento de lenguaje natural y aprendizaje profundo, el software de traducción automática analiza los elementos lingüísticos del idioma original, reconoce cómo las palabras se influyen entre sí y luego comunica su significado completo en un nuevo idioma.

La traducción automática utiliza IA para traducir automáticamente texto y voz de un idioma a otro. Se basa en el procesamiento del lenguaje natural y el aprendizaje profundo para comprender el significado de un texto determinado y traducirlo a diferentes idiomas sin necesidad de traductores humanos.

Las herramientas populares de traducción automática incluyen Google Translate y Microsoft Translator, los cuales son capaces de traducir tanto idiomas hablados como escritos. Se basan en todo el conocimiento existente sobre el procesamiento del lenguaje natural, incluida la gramática, la comprensión y la generación de idiomas, y producen rápidamente traducciones a cientos de idiomas diferentes.

La traducción automática está lejos de ser perfecta, y estos sistemas no producen traducciones tan rápidas o fluidas como los dispositivos representados en historias de ciencia ficción como La guía del autoestopista galáctico o Star Trek. Aún así, esta tecnología ha recorrido un largo camino a lo largo de las décadas y promete ser un gran disruptor para la traducción de idiomas en el futuro.

Alimento para el pensamiento ¿Alguna vez veremos un traductor universal de 'Star Trek' en la vida real?

La traducción automática se remonta a la década de 1950, cuando Estados Unidos la usó para espiar a Rusia y otros países durante la Guerra Fría, lo que la convirtió en "la aplicación original de inteligencia artificial", según Maite Taboada, profesora de lingüística en la Universidad Simon Fraser de Gran Bretaña. Colombia, Canadá.

Los métodos utilizados entonces requerían programar extensos diccionarios bilingües y reglas gramaticales en computadoras a mano para traducir un idioma a otro. A principios de la década de 2000, las computadoras comenzaron a usar el aprendizaje automático para analizar texto y hacer predicciones estadísticas, determinando la probabilidad de que una palabra o frase en particular en un idioma de origen sea una palabra o frase correspondiente en un idioma de destino.

Hoy en día, confiamos en la traducción automática neuronal, que utiliza el aprendizaje profundo para aprender nuevos idiomas y luego mejorar continuamente ese conocimiento utilizando un método de aprendizaje automático específico llamado redes neuronales, donde los datos de entrada pasan a través de varios nodos interconectados para generar una salida, similar a la forma en que funciona el cerebro humano.

El software de traducción automática neuronal funciona con conjuntos de datos masivos y considera la oración de entrada completa en cada paso de la traducción en lugar de dividirla en palabras o frases individuales como otros métodos. Es más capaz de capturar, incluso comprender, la intención o el significado de una oración y, como resultado, ha reemplazado rápidamente a muchos de los modelos estadísticos más antiguos.

Un avance más reciente en la traducción automática neuronal fue la creación de redes neuronales transformadoras: la "T" en GPT, que impulsa grandes modelos de lenguaje, o LLM, como ChatGPT de OpenAI y Bard de Google. Los transformadores aprenden patrones en el lenguaje, comprenden el contexto de un texto de entrada y generan una salida adecuada. Esto los hace particularmente buenos para traducir texto a diferentes idiomas.

Usando una técnica llamada "autoatención", los transformadores pueden enfocarse selectivamente en diferentes partes de una oración de entrada, sopesar su importancia en función de cuán relevantes son entre sí e identificar relaciones importantes entre ellas para que pueda traducirlas con precisión a otra. idioma. También reciben capacitación sobre cantidades masivas de datos de texto bilingüe, lo que les ayuda a aprender los matices de diferentes idiomas y mejora su capacidad para generar traducciones precisas.

"Con los modelos de transformadores también predices [la siguiente palabra], al igual que cualquier modelo de lenguaje grande. Pero lo predices en contexto", dijo a Built In Olga Beregovaya, vicepresidenta de IA y traducción automática de la empresa de traducción Smartling. "Si bien los modelos de idiomas grandes están capacitados para una variedad de tareas, la última generación de LLM se desempeña igualmente bien en tareas de traducción".

En su nivel más sofisticado, la traducción automática es esencialmente una forma de IA generativa, donde los LLM se utilizan para producir texto automáticamente. Por ejemplo, si un usuario solicita a ChatGPT en inglés que le dé una receta de éclair de chocolate en francés, el resultado es un ejemplo de traducción automática.

Hasta este punto, la traducción automática neuronal sin el uso de modelos transformadores ha sido objetivamente precisa, pero carecía de la fluidez del lenguaje natural. Y el texto generado por IA se ha vuelto bastante conversacional, pero puede estar muy equivocado sobre las cosas.

La próxima iteración de la traducción automática probablemente combinará las fortalezas de los LLM y la traducción automática neuronal para generar una traducción de idiomas más natural y precisa. De hecho, Beregovaya dice que ya está sucediendo con GPT-4, el modelo de lenguaje más avanzado de OpenAI.

"GPT-4 ya está produciendo copias de traducción automática, a menudo de calidad superior, para ciertas direcciones de traducción, a la traducción automática neuronal", dijo. "¿Habrá una convergencia tecnológica real? Eso está por verse. Pero definitivamente aprenderán y cosecharán unos de otros".

Mirando hacia el futuroEl futuro de la IA: cómo la inteligencia artificial cambiará el mundo

Las herramientas modernas de traducción automática tienen muchas ventajas, especialmente en aplicaciones comerciales.

La traducción automática es esencialmente un "mejorador de la productividad", según Rick Woyde, CTO y CMO de la empresa de traducción Pairaphrase. Puede proporcionar traducciones consistentes y de calidad a escala y con una velocidad y capacidad que ningún equipo de traductores humanos podría lograr por sí solo.

Y con las mejoras continuas en los algoritmos de aprendizaje automáticoy la tecnología informática, es probable que la traducción automática sea aún más rápida y eficiente en el futuro.

Los sistemas de traducción automática también pueden continuar aprendiendo gracias al aprendizaje no supervisado, una forma de aprendizaje automático que implica el procesamiento de entradas y salidas de datos no etiquetados para predecir resultados. Con el aprendizaje no supervisado, un sistema puede identificar patrones y relaciones entre datos no etiquetados por sí solo, lo que le permite aprender de manera más autónoma.

Esto es ideal para la traducción automática. A medida que se produce y alimenta más contenido, la calidad de sus traducciones puede mejorar. Los motores pueden aprender nuevas palabras, frases e incluso idiomas con el tiempo.

La traducción automática hace gran parte del trabajo pesado inicial de la traducción de idiomas, minimizando la necesidad de participación humana, lo que puede reducir tanto el costo como el tiempo de entrega. Por ejemplo, las empresas pueden integrar un motor de traducción automática en su sistema de gestión de contenido para traducir automáticamente la información que contiene a diferentes idiomas sin tener que pagar a un equipo de personas para que lo haga a mano.

"Hoy se puede hacer mucho más con menos gente", dijo Woyde. "La comparación de costos es ridículamente a favor de la tecnología actual".

"La comparación de costos es ridículamente a favor de la tecnología actual".

Eso no quiere decir que la traducción automática eliminará por completo a los traductores humanos. Más bien, sus trabajos simplemente cambiarán. A medida que se entrena un modelo de traducción automática, los traductores humanos pueden crear glosarios de términos específicos y las traducciones correctas de esos términos. Se convierten, en cierto sentido, en ingenieros de software que dictan las reglas que debe seguir una máquina. Luego, una vez que se realiza la traducción, pueden ingresar y realizar ediciones o modificaciones cuando sea necesario.

Ese tipo de trabajo es especialmente importante para crear un modelo de traducción automática que esté más ajustado a una industria o empresa específica. Por ejemplo, la palabra "embrague" en la industria automotriz significa algo muy diferente a lo que significa en la industria de la moda, y un sistema de traducción automática puede necesitar que un ser humano le enseñe eso.

"Con un glosario, puede reducir el 50 por ciento de sus errores allí mismo", dijo Woyde. "Ahí es hacia donde nos dirigimos. Donde puede usar cantidades más pequeñas de datos para mejorar la traducción que obtiene de una máquina. Y puede hacerlo a escala".

La traducción automática puede ser una forma económica y eficaz de mejorar la accesibilidad. Muchos de los principales proveedores de traducción automática ofrecen cientos de idiomas y pueden entregar traducciones simultáneamente para varios idiomas a la vez, lo que puede ser útil para llegar rápidamente a una audiencia multilingüe.

Tampoco se trata solo de romper las barreras del idioma. Las personas ciegas o con problemas de visión pueden usar la tecnología de conversión de texto a voz habilitada para la traducción automática, de modo que un texto se pueda traducir y leer en voz alta al mismo tiempo, lo que les permite acceder a la información de una manera mucho más conveniente.

Al eliminar las barreras del idioma y mejorar la experiencia del usuario, la traducción automática puede impulsar la accesibilidad de contenido, productos y servicios para audiencias de todo el mundo.

Si bien la traducción automática ha recorrido un largo camino y continúa beneficiando a las empresas, no es perfecta. Todavía existen varios desafíos relacionados con la capacitación de sistemas de traducción automática y muchos casos en los que esta tecnología no es una solución ideal.

Como cualquier modelo de IA, los sistemas de traducción automática solo saben lo que se incluye en su conjunto de datos de entrenamiento. Y debido a que el aprendizaje profundo utiliza métodos no supervisados, aprenden todo extrayendo datos del mundo, ya sea que esos datos estén sesgados o no. Como resultado, heredan los mismos problemas y sesgos que existen en el mundo real.

Esto es especialmente cierto para los idiomas que deben clasificar sus sustantivos como masculinos o femeninos, como el francés y el español. Por ejemplo, si las palabras "doctor" y "nurse" se traducen del inglés al español, deben tener un género asociado. Los géneros que el motor de traducción automática decida usar probablemente estarán vinculados al género predominante asociado con médicos y enfermeras en sus datos de capacitación.

"De alguna manera reproduce el mundo tal como es, no como queremos que sea".

"Pronosticará que las enfermeras son mujeres y los médicos son hombres", dijo el profesor de lingüística Taboada. "De alguna manera reproduce el mundo tal como es, no como queremos que sea".

Mientras tanto, otros conjuntos de datos de entrenamiento pueden tener una gran cantidad de datos en algunos idiomas y no lo suficiente en otros, lo que significa que el motor de traducción automática no funcionará con tanta precisión para esos idiomas subrepresentados. Es posible que sus algoritmos no puedan diferenciar entre matices como los dialectos, lo que hace que las traducciones sean inadecuadas.

Más sobre el sesgo de IA Oye Siri, ¿los asistentes de voz de IA refuerzan el sesgo de género?

En muchos casos, la traducción automática no generará un resultado preciso sin alguna edición o asistencia de humanos. No importa cuántos datos se introduzcan en un motor de traducción automática, tendrá problemas con las sutilezas del lenguaje.

La traducción automática tiende a tropezar con diferentes reglas sintácticas o gramaticales que son específicas de idiomas particulares. Y si un motor se encuentra con un vocabulario raro o especializado en el que no ha sido entrenado, como términos de la industria o jerga específica de la industria, puede arrojar traducciones incorrectas o incompletas si no hay un humano en el circuito para realizar las ediciones.

Y muchos idiomas contienen expresiones idiomáticas que no tienen sentido cuando se traducen literalmente. Por ejemplo, tener una "rana en la garganta" no significa que alguien tenga un anfibio en la boca; significa que han perdido la voz. Es probable que un motor de traducción automática no se dé cuenta de eso y simplemente lo traduzca literalmente, lo que podría generar algunos resultados bastante incómodos en otros idiomas.

Esto hace que la traducción automática sea una solución menos que óptima para traducir textos más creativos, como novelas o incluso periodismo narrativo. La traducción automática no tiene los matices ni los conocimientos contextuales necesarios para filtrar Guerra y paz, una obra de ficción escrita originalmente en ruso, y traducirla adecuadamente a cualquier otro idioma.

"La traducción automática no tiene cerebro".

"La traducción automática no tiene cerebro", dijo Beregovaya de Smartling. "Es una red neuronal, pero es un modelo matemático. Y el modelo matemático no está diseñado para comprender las figuras del lenguaje".

Aunque los motores de traducción automática sobresalen en el análisis de oraciones completas, aún tienen dificultades para comprender la relación de una oración con las oraciones anteriores y posteriores. Entonces, si una persona quisiera traducir "Mary es doctora. El doctor entró en la habitación" al español, el motor traduciría correctamente "doctor" a "médica" en la primera oración, pero luego lo traduciría incorrectamente a "médico". en la segunda oración, porque no recuerda el contexto de que la doctora sea una mujer llamada María de la oración anterior.

Ese problema puede aparecer en otras formas de contexto, como el tono o la cultura.

Por ejemplo, algunos idiomas usan diferentes pronombres según la persona a la que se dirige: si una persona se dirige a un amigo en francés, diría "tu" por ti, pero si se dirige a su jefe, diría "vous". Sin embargo, un motor de traducción automática probablemente no conocería esa complejidad, porque no entiende cómo la gramática francesa se entrelaza con el contexto y la cultura.

Lectura relacionada¿Quieres usar IA? Invierta primero en Business Intelligence

La traducción automática suele funcionar mejor cuando el contenido de origen es más instructivo y directo que creativo, o si el objetivo final es transmitir un mensaje rápidamente en lugar de generar una traducción perfecta y matizada.

"Es [bueno para] lo que llamaríamos 'gisting'", dijo Woyde de Pairaphrase, "donde quiero obtener la esencia de la idea".

Para las empresas con muchos empleados repartidos por todo el mundo, el envío de comunicaciones uniformes y completas en toda la empresa puede ser difícil de gestionar. Las habilidades lingüísticas pueden variar de una oficina a otra, de un empleado a otro, y es posible que algunos no dominen el idioma oficial de operaciones de la empresa.

La traducción automática puede ayudar a reducir o eliminar esta barrera del idioma al permitir que las empresas traduzcan sus comunicaciones internas a escala. Esto puede ser útil para crear tickets de soporte técnico, boletines de la empresa, presentaciones y materiales de capacitación.

Lo mismo puede decirse de las comunicaciones externas, donde una empresa quiere poder llegar a una audiencia global con eficiencia. Es bueno para traducir videos, publicaciones de blogs, materiales de marketing y contenido generado por usuarios, como reseñas de productos.

Por ejemplo, Beregovaya dice que empresas como Tripadvisor han estado utilizando la traducción automática para traducir todas las opiniones de sus usuarios durante años, lo que permite a los clientes averiguar cuál es el mejor restaurante de Santorini, por ejemplo, sin tener que saber griego.

Tanto para las comunicaciones internas como para las externas, la traducción automática se puede realizar con o sin un traductor humano en el proceso, siempre que no sea imperativo que el material sea perfectamente fluido en el idioma traducido.

La traducción automática con humanos involucrados en la capacitación o la posedición son más para contenido que quizás sea demasiado complicado para que un motor de traducción automática lo maneje por sí solo. O las apuestas pueden ser demasiado altas si el motor falla en algo. Esto es bueno para traducir contenido en espacios altamente regulados como la ley y la medicina, como patentes, juicios, resultados de ensayos clínicos y advertencias sobre medicamentos.

"Con un ser humano en el circuito, se producen traducciones 100 por ciento adecuadas, utilizables, fluidas, gramaticalmente correctas y de marca", dijo Beregovaya. "A partir de ahí, los casos de uso se expanden indefinidamente".

Aquí hay un puñado de herramientas de traducción automática que marcan el comienzo de una nueva era de traducción de idiomas habilitada por tecnología.

Posiblemente la herramienta de traducción automática más popular, Google Translate ofrece servicios de traducción gratuitos en más de 100 idiomas. Fue uno de los primeros motores de este tipo en implementar la traducción automática neuronal, ahora una práctica estándar en la industria.

Usando la traducción automática neuronal, la plataforma traduce el texto que se escribe directamente en su interfaz. Y está integrado con Google Docs para permitir a los usuarios traducir texto directamente allí. Los usuarios también pueden tomar una foto de algo, un letrero de una calle o un periódico, por ejemplo, y Google Translate traducirá automáticamente el texto de esa imagen a un idioma diferente.

Microsoft Translator permite a los usuarios traducir todo, desde conversaciones en tiempo real hasta menús y documentos de Word. También tiene una función de traductor personalizado diseñada específicamente para empresas, desarrolladores de aplicaciones y proveedores de servicios lingüísticos para crear un sistema de traducción neuronal que se ajuste a sus propias necesidades. Con Traductor personalizado, los usuarios también pueden personalizar el texto mediante el servicio Traductor en Azure y la traducción de voz mediante el servicio Voz en Azure.

Microsoft también ofrece funciones de traducción personalizadas hechas específicamente para la educación, proporcionando herramientas que pueden traducir y subtitular conferencias y presentaciones, conferencias de padres y maestros y grupos de estudio.

Con Pairaphrase, las empresas pueden traducir cualquier cosa, desde archivos PDF escaneados hasta correos electrónicos. Una vez que han realizado una traducción, la plataforma retiene esa información y utiliza el aprendizaje automático para mejorar su calidad con el tiempo.

Pairaphrase también ofrece un componente de seguridad de datos, una distinción importante en un momento en que la IA generativa y otros modelos de inteligencia artificial plantean nuevos tipos de riesgos para la privacidad de los datos. La plataforma permite a las empresas mantener todos los documentos patentados, traducciones, glosarios, etc., completamente confidenciales y seguros, y nunca los comparte públicamente ni los indexa en los motores de búsqueda.

Más informaciónContenido generado por IA y ley de derechos de autor: lo que sabemos

Amazon Translate utiliza la traducción automática neuronal para permitir traducciones de idiomas rápidas y de alta calidad. La plataforma mejora continuamente para producir traducciones más precisas con el tiempo y constantemente agrega nuevos idiomas.

Translate puede integrarse en los otros canales de una empresa y puede procesar contenido en varios formatos. Su personalización y escalabilidad hace que sea fácil de usar para todo tipo de proyectos, desde traducir contenido generado por el usuario hasta agregar traducción en tiempo real dentro de aplicaciones de chat, correo electrónico, mesa de ayuda y emisión de boletos.

Cientos de empresas, incluidas Lyft, Shopify y Peloton, utilizan la herramienta de traducción automática de Smartling para automatizar y crear sitios web multilingües, campañas de marketing, productos web y móviles y experiencias de clientes.

Su plataforma de gestión de traducción automática basada en la nube ofrece gestión de flujo de trabajo y contenido impulsado por IA, paneles de control de rendimiento y progreso, e ingesta de contenido automatizada. Los clientes pueden utilizar uno de los traductores humanos de Smartling, con quienes pueden comunicarse directamente y compartir guías de estilo y glosarios, o su motor de traducción automática neuronal.

La llamada plataforma "LangOps" de Unbabel combina traducción humana y automática para ayudar a las empresas a brindar servicios multilingües de experiencia del cliente y expandirse a nuevos mercados. Esto incluye traducciones de chat en tiempo real entre agentes de atención al cliente y clientes, comunicados de prensa, campañas de marketing por correo electrónico y libros electrónicos y documentos técnicos.

Unbable puede integrarse directamente en el CRM y el abogado de una empresa en los canales digitales que ya utilizan, incluidos el correo electrónico, el chat y las redes sociales. La compañía afirma que puede ayudar a las empresas a implementar su contenido hasta un 65 por ciento más rápido y reducir los costos a más de la mitad en comparación con el uso de traductores humanos.