Memoria di traduzione

La memoria di traduzione (in inglese translation memory, TM) è un particolare tipo di database utilizzato in programmi software progettati per assistere e aiutare il processo di traduzione.

Alcuni programmi che usano memorie di traduzione sono noti come manager di memorie di traduzione (TMM).

Le memorie di traduzione vengono tipicamente utilizzate con strumenti dedicati, ad esempio Traduzione Assistita da Computer Computer Assisted Translation (CAT), programmi per la videoscrittura, sistemi per la gestione della terminologia, dizionari multilingue, o anche risultati grezzi di traduzione automatica.

L'idea che sta alla base delle memorie di traduzione risale alla fine degli anni settanta, tuttavia queste sono state immesse per la prima volta sul mercato solo alla fine degli anni '80.

Una memoria di traduzione è composta da segmenti di testo del brano da tradurre in una lingua emittente e dalle corrispondenti traduzioni in una o più lingue riceventi. Questi segmenti, o stringhe, possono essere interi blocchi di testo, paragrafi frasi o sintagmi. Le coppie che si creano sono chiamate "unità di traduzione". Le singole parole, invece, non vengono gestite direttamente dalle TM, ma da database terminologici.

Alcune ricerche dimostrano che molte ditte produttrici di documentazione multilingue usano sistemi di gestione di memorie di traduzioni. In un'indagine su professionisti della traduzione nel 2006, l'82,5% di 874 questionari ha confermato l'utilizzo di TM.^[1]

L'uso di TM è correlato con tipi di testo caratterizzati da termini tecnici e strutture di proposizione semplici (tecniche o seppure in minor grado, commerciali e finanziarie), buona esperienza nell'ambito dei computer, e ripetitività dei contenuti^[1]

Il traduttore fornisce al software di gestione della memoria di traduzione un brano origine da tradurre o prototesto. Il programma quindi divide il prototesto in segmenti, ricerca eventuali corrispondenze tra tali segmenti e i segmenti origine precedentemente tradotti e inseriti in memoria di traduzione disponibili, poi propone le corrispondenze trovate come possibili soluzioni di traduzione. Il traduttore può accettare le corrispondenze proposte ovvero sostituirle o modificarle per adattarle meglio al significato del prototesto e utilizzare la versione modificata. Negli ultimi due casi il segmento di prototesto e il corrispondente segmento tradotto metatesto, abbinati, sono inseriti nella memoria di traduzione.

Alcuni programmi per la gestione di memorie di traduzione cercano solo le concordanze al 100% (concordanze esatte), vale a dire recuperano solo segmenti di testo che corrispondono esattamente alle unità di traduzione presenti nelle memorie di traduzione. Altri invece utilizzano algoritmi di corrispondenza approssimati, fuzzy: cercano stringhe che corrispondono parzialmente al segmento origine e le propongono al traduttore evidenziando le differenze; questi potrà peraltro impostare nel programma la percentuale di concordanza minima da considerare.

La flessibilità e la robustezza degli algoritmi di ricerca delle concordanze determinano ampiamente le prestazioni del programma di gestione della memoria di traduzione, anche se per alcune applicazioni la percentuale di corrispondenze esatte è tanto alta da giustificare l'utilizzo delle sole concordanze esatte.

I segmenti che non hanno nessuna corrispondenza in memoria dovranno essere tradotti manualmente dal traduttore. Questi nuovi segmenti tradotti vengono archiviati nel database, dove possono essere utilizzati per traduzioni future e nelle ripetizioni dello stesso brano in corso di traduzione.

Le memorie di traduzione sono particolarmente efficienti per la traduzione di testi molto ripetitivi, come ad esempio i manuali tecnici. Sono utili anche per tradurre cambiamenti aggiunti man mano a un testo già tradotto in precedenza, in quanto permettono, per esempio, di trattare un minor numero di cambiamenti in una nuova versione di un manuale.

Al contrario, le TM sono tradizionalmente considerate inadeguate per la traduzione di testi letterari per il semplice motivo che in questo tipo di testi la ripetizione è assente, o quasi. Tuttavia, alcuni le trovano utili anche per testi non ripetitivi, perché le risorse database create per le ricerche di concordanza hanno un valore per determinare l'uso appropriato dei termini, per l'assicurazione della qualità (nessun segmento vuoto), e per la semplificazione del processo di revisione (segmento sorgente e destinazione sono sempre visualizzati insieme, mentre i traduttori, in un ambiente di revisione tradizionale, devono lavorare con due documenti).

^ ^a ^b Errore nelle note: Errore nell'uso del marcatore <ref>: non è stato indicato alcun testo per il marcatore nota1

[nota1-1] Errore nelle note: Errore nell'uso del marcatore <ref>: non è stato indicato alcun testo per il marcatore nota1

[1]