Consideraciones sobre la inteligencia artificial y la traducción automática

4 octubre, 2023
Photo by Mohamed Hassan – Pixabay

Con la llegada de ChatGPT, ha surgido interés por la posibilidad de utilizar esta herramienta como traductor automático. ChatGPT tiene esta capacidad y, por lo tanto, queremos saber en qué casos sería posible sacarle partido (principalmente entre el catalán y el castellano, y entre estos dos idiomas y el inglés). ¿Cuáles son las diferencias entre las traducciones que salen de ChatGPT y las traducciones que salen de las herramientas de traducción automática que ya conocemos? ¿En qué casos sería mejor una u otra? El equipo del Servicio Lingüístico de la Universitat Oberta de Catalunya ha preparado este texto que nos ayudará a aclarar algunas cuestiones.

¿Cuáles son los rasgos diferenciales de ChatGPT?

  • ChatGPT tiene más capacidad para conseguir coherencia a lo largo del texto que produce que las herramientas de TA. En general, las herramientas de TA traducen frase por frase, sin tener en cuenta la traducción de la frase anterior. ChatGPT, en cambio, analiza todo el texto como conjunto. 👍
  • Es posible que ChatGPT priorice la legibilidad del resultado por encima de la fidelidad de la traducción. Por lo tanto, puede generar traducciones que se leen como buenos textos, pero que presentan diferencias respecto al sentido del original. Se ha comprobado que, a veces, ChatGPT «alucina» (se inventa cosas). Debido a estos aspectos, la tarea de revisar la traducción será intensiva, puesto que las divergencias respecto al sentido del original pueden aparecer en cualquier lugar; no hay forma de preverlas. 👎
  • ChatGPT puede ofrecer varias traducciones del mismo texto original. Por un lado, puede generarnos incertidumbre si no tenemos claro qué versión es la mejor, pero por otro lado –quizá más importante–, nos permite refinar la traducción y adaptarla a la finalidad y/o al público. 👍
  • Existen varias dudas legales hacia el uso de ChatGPT en general: la propiedad intelectual, los derechos de autor, el plagio o la protección de datos. 👎

¿Cuáles son las diferencias entre las traducciones que salen de ChatGPT y las traducciones que salen de las herramientas de traducción automática que ya conocemos? ¿En qué casos sería mejor una u otra?

¿Cuáles son los rasgos diferenciales de las herramientas de TA que ya conocemos?

La TA basada en reglas (como Apertium, el motor que utiliza traductor.uoc.edu en las traducciones CA<>ES):

  • El hecho de que la TA basada en reglas no utilice la inteligencia artificial es positivo. ¿Por qué? Porque esto significa que no es capaz de inventarse cosas, significa que el texto de salida reflejará con fidelidad el texto de entrada. También significa que es relativamente fácil introducir mejoras en el sistema (mediante reglas y diccionarios); por ejemplo, sabe que una PAC en catalán es una PEC en castellano. El traductor de la UOC es capaz de traducir documentos y mantener el formato (incluso el formato especial de XML de la UOC). 👍
  • Con la TA basada en reglas, podemos conocer la tipología de cosas que traduce bien y de errores que comete. Este conocimiento de cómo funciona facilita mucho la posedición de la traducción. 👍
Photo by Trid India – Pixabay

La TA neuronal (utilizada en las combinaciones CA/ES<>EN por traductor.uoc.edu y también DeepL o Google Translate):

  • Para combinaciones de lenguas más alejadas (como puede ser el inglés y el catalán), la traducción neuronal ofrece resultados más aceptables que los sistemas basados en reglas. 👍
  • La traducción neuronal puede aprender: existe la posibilidad de reentrenar el sistema con textos ya traducidos para mejorarlo. Esta mejora no necesita un esfuerzo humano, solo el tiempo de computación. 👍
  • Las tecnologías tras la TA neuronal y ChatGPT se parecen bastante, y los resultados de traducción de cada herramienta también. Hoy en día, posiblemente la única razón para sustituir la TA neuronal por la traducción con ChatGPT sería para experimentar (el uso de ChatGPT para la traducción es todavía muy reciente). 🤷
  • Uno de los problemas de la TA neuronal es la detección de errores difíciles de ver en las traducciones (que pueden parecer correctos si no te fijas bien en el texto de partida). El mismo problema existe con ChatGPT, pero la dificultad puede ser mayor, puesto que la fluidez es del texto entero, no solamente de cada frase individual. 🤷
  • Solo utilizamos la TA neuronal en determinados casos, por ejemplo, para entender el sentido general de un texto en un idioma desconocido, o para tener el borrador de una traducción cuando es aceptable que la traducción sea bastante literal. Para la comprensión general de un texto, es posible que ChatGPT «alucine» más que la TA neuronal, y aunque no siempre sea así, no hay razones evidentes para utilizar ChatGPT en vez de la TA neuronal. Para el otro uso, si queremos un resultado que pueda publicarse, será necesaria la intervención de un traductor humano (una persona con conocimientos elevados de ambos idiomas y del contexto) que posedite la traducción. Esta figura también sería necesaria en el caso de la traducción por ChatGPT, pero posiblemente tendría más trabajo debido a la dificultad de identificar los errores (tal y como hemos comentado en el punto anterior). 🤷

Conclusiones

En el caso de las combinaciones de idiomas que hacen un buen uso de la TA basada en reglas, como catalán<>castellano, no parece que haya argumentos para utilizar ChatGPT como traductor, ya que implicaría una carga de trabajo muy superior en la posedición, y una pérdida en cuanto a la fiabilidad.

En cuanto a la TA neuronal, también habría un incremento en el trabajo de posedición si la cambiáramos por la traducción con ChatGPT. Los posibles beneficios no están comprobados, y no incluyen una solución para el problema más importante: que no existen garantías de que las traducciones estén libres de falsos sentidos. Así pues, no vemos claro, de momento, que podamos recomendar la traducción a través de ChatGPT.

Sin embargo, estaremos atentos a la evolución de las herramientas de inteligencia artificial, que pueden ser útiles para la traducción en el futuro.

 

(Visited 194 times, 1 visits today)
Autor / Autora
Equip:  Pilar Murtra, directora del Servicio  Thomas Bell, técnico lingüístico  David Cullen, técnico lingüístico  Jordi Gavaldà, técnico lingüístico  Xavier Marzal, técnico lingüístico  Alba Pérez, técnica lingüística