Memoria de traducción

Las memorias de traducción son almacenes compuestos de textos originales en una lengua alineados con su traducción en otras. Esta definición de memorias de traducción coincide literalmente con una de las definiciones más aceptadas de corpus lingüístico de tipo paralelo (Baker, 1995). Por esto se puede decir que las memorias de traducción son corpus paralelos.

Así, las memorias de traducción o los corpus paralelos se componen de textos originales o lengua original y el texto traducido en la lengua de destino. Estos textos además están alineados por unidades de traducción o segmentos. Las unidades de traducción que se almacenan junto con sus equivalentes se definen de forma variable siendo la segmentación tras un signo de puntuación que marca el final de la frase (., ?, !, :, ...) o un salto de párrafo las más frecuentes ofrecidas por defecto en el entorno de los sistemas de traducción asistida.

Generalidades

La principal función de las memorias de traducción (en adelante, MT) es extraer sugerencias totales o parciales de una frase y concordancias para términos. Durante la traducción, se buscan segmentos del idioma de origen en la base de datos de la MT. Si la MT posee un segmento en el idioma de origen que coincide exactamente, este segmento se mostrará en la parte de MT de la ventana, junto con su traducción y la información adicional guardada con el segmento en la base de datos. El grado de similitud es del 100 %.

Si la MT contiene solo un segmento que no es idéntico, sino simplemente similar al segmento de origen, este segmento también se mostrará junto con su traducción y el grado de similitud calculado por el sistema MT. Un segmento no exacto es llamado «fuzzy match» (coincidencia parcial) en todos los sistemas de MT.

El límite del grado de similitud aceptable para el traductor se puede adaptar en todos los sistemas de MT.

El contenido de estos recursos lingüísticos paralelos es fundamental, pero también es crucial el motor de búsqueda que permite explorar una gran cantidad de texto e identificar patrones lingüísticos y terminológicos comunes. Por tanto, si el contenido de las memorias y si su sistema de indización ofrece buenos resultados, estas memorias se convierten en el mejor instrumento de trabajo del mediador lingüístico.

En esta línea Abaitua (2002) afirma que los corpus paralelos son una alternativa a los diccionarios como fuente única de información y, como ya hemos dicho, por definición las memorias de traducción constituyen textos paralelos.

El almacén de traducciones, es decir, el corpus paralelo, va creciendo en función del volumen y frecuencia de alimentación de las memorias de traducción y estas se crean durante la validación de las unidades de traducción durante el proceso de traducción en el entorno de la traducción asistida.

Otra de las técnicas para la generación de memorias de traducción es mediante la alineación de textos traducidos y por tanto equivalentes. La alineación se lleva a cabo con herramientas específicas para ello, conocidas como alineadores.

Muy frecuentemente se utiliza el término de memorias de traducción para identificar los sistemas de traducción asistida por ordenador (en inglés, CAT Tools), que son programas informáticos diseñados para ayudar a los traductores profesionales.

Las memorias de traducción han sido fundamentales para el surgimiento de la industria del lenguaje a escala global.

Other Languages