Becca & InfoMarex


Vai ai contenuti

Come funzionano?

Area traduttori > Traduzioni gratuite

Come funzionano i traduttori gratuiti on line? Risponde Mario Spoto


Ci siamo posti la domanda: come funzionano i software che traducono istantaneamente i testi on line? La risposta ce l'ha fornita l'Ing. Mario Spoto specialista della nota società Syntema (http://www.synthema.it/) una delle più importanti centri di studio dedicata all'intelligenza artificiale.


1. Ing. Spoto come funzionano i programmi specializzati nella traduzione istantanea? Quali strategie utilizzano per "riversare" i testi da una lingua all'altra?

"È possibile raggruppare i sistemi di traduzione automatica in due gruppi:
" Sistemi basati su regole (Rule based) e
" Sistemi statistici

Con tutte le approssimazioni che un raggruppamento così "grossolano" comporta, è possibile dire che nei sistemi basati su regole la traduzione è basata sulla formalizzazione delle conoscenze linguistiche rappresentate da dizionari e grammatiche. Lo schema classico utilizza tre moduli: un modulo per l'analisi della lingua sorgente, uno per il transfer e uno per la generazione delle frasi nella lingua di destinazione. In pratica la frase sorgente viene analizzata cercando di costruirne l'albero sintattico. Utilizzando poi le regole di una grammatica "contrastiva" si cerca di creare la struttura sintattica equivalente nella lingua di destinazione e infine con un processo di sintesi si tenta di generare la frase corretta nella lingua di destinazione. La figura sotto riassume in modo schematico questo approccio.

C:\Documents and Settings\Proprietario\Desktop\schema spoto.jpg
Error File Open Error


L'approcio statistico si basa sull'uso di corpora bilingue di notevoli dimensioni per costruire un modello statistico (basato su catene di Markov o reti neurali) da utilizzare in seguito per la traduzione di nuovi testi. In pratica si costruisce un sistema che viene addestrato a riconoscere una certa sequenza di parole nella lingua sorgente e stabilire quale sequenza di parole corrispondenti nella lingua di destinazione ha la maggior probabilità di rappresentarne la traduzione.

Esistono poi degli approcci "misti" che, ad esempio, a partire dai sistemi statistici utilizzano delle regole sintattiche per trattare gruppi di parole."


2. Come possono essere gratuiti? Voglio dire, si tratta di una ricerca software così poco costosa?
"La ricerca nel campo dei sistemi di traduzione automatica è costosa perché coinvolge delle figure altamente specializzate con competenze approfondite di linguistica computazionale. Volendo entrare un po' più nel dettaglio è possibile dire che tra i due approcci, quello basato su regole è quello più costoso perché la costruzione di un sistema di traduzione è legato alla coppia di lingua che si desidera tradurre. Se, ad esempio, realizziamo i tre moduli di un sistema per la traduzione automatica dall'italiano all'inglese e decidiamo in seguito di costruire un sistema per la traduzione automatica dall'italiano al tedesco, potremmo "riutilizzare" solo il modulo per l'analisi della lingua sorgente, mentre saremmo costretti a realizzare un nuovo modulo di transfer italiano->tedesco e un nuovo modulo di sintesi per la lingua tedesca (oltre a un dizionario bilingue italiano/tedesco).

Nell'approccio statistico invece, in linea di massima, dopo aver costruito un motore di traduzione, è necessario "solamente" disporre di corpora bilingue sufficientemente grandi da poter addestrare il sistema. Nel caso descritto prima, ad esempio, dopo aver realizzato un sistema per la traduzione da italiano ad inglese sarebbe sufficiente disporre di un corpus bilingue italiano/tedesco per addestrare lo stesso sistema. In assenza di tale corpus sarebbe addirittura possibile costruirlo "allineando" (con degli appositi strumenti informatici) dei testi italiani e la corrispondente traduzione tedesca, operazione questa che richiede delle competenze (e di conseguenza costi) inferiori rispetto alla creazione di una grammatica contrastiva tra italiano e tedesco.

Il motivo per cui spesso la traduzione automatica viene offerta gratuitamente (ad esempio Google, Microsoft, ecc.) è legata a logiche di promozione e diffusione brand, oppure a politiche commerciali che si basano sull'offerta gratuita di un livello base di servizi/prodotti per trainare la vendita di servizi/prodotti professionali, o ancora alla volontà di offrire servizi in grado di attirare traffico su portali che permettono il ritorno dell'investimento mediante inserzioni pubblicitarie a pagamento."


3.Quali prospettive pensi possano avere nel breve termine (nel lungo termine si può solo indovinare, penso)?
"La quantità di contenuti in diverse lingue pubblicati su Web è in costante aumento, così come è in aumento la necessità di comunicazioni istantanee multilingue (blog, chat, forum e mail) e di accesso rapido alle informazioni disponibili sul Web. Tutto questo si traduce in un aumento della richiesta di traduzione automatica sia per la comprensione dei contenuti in lingue diverse dalla propria che per la scrittura di messaggi e brevi testi in altre lingue. Chi utilizza un traduttore automatico lo fa non solo per comprendere un testo in lingua straniera, ma spesso anche per avere una sorta di bozza da rielaborare che sia di aiuto nella scrittura in lingua straniera (ad esempio inglese) di una breve frase da usare poi in una mail o in un programma di messaggistica istantanea.

Anche a livello aziendale sono in aumento le imprese che si affacciano al mondo della traduzione automatica, in passato esclusiva delle grandi multinazionali, interessandosi ai sistemi di traduzione automatica sia per le comunicazioni intra-aziendali che inserendoli nel processo di produzione dei contenuti.
Certo in quest'ultimo campo (soprattutto in Italia) c'è ancora molta strada da fare, soprattutto per quanto riguarda la realizzazione di un processo che veda produzione e traduzione dei contenuti aziendali come strettamente integrati e dipendenti.

Per il futuro, potrebbe darsi che la maggior attenzione al contenimento dei costi spinga un maggior numero di aziende a scrivere i propri contenuti "pensando alla traduzione", curando quindi maggiormente l'aspetto redazionale (guide di stile, terminologia ed eventualmente uso di linguaggi controllati) e scrivendo contenuti per i quali la traduzione automatica potrebbe produrre dei risultati soddisfacenti, permettendo di recuperare rapidamente l'investimento necessario."


4. Da tecnico del settore, quale sceglieresti? E per quali traduzioni?
"A livello di utilizzo professionale non esiste in assoluto un sistema migliore di un altro. È necessario comprendere la situazione nella quale un sistema di traduzione deve essere utilizzato per poter scegliere quello più adatto.
In linea di massima è possibile utilizzare i sistemi basati su regole per tradurre contenuti di tipo generico o non omogeneo oppure, insieme a dei dizionari specifici, contenuti specialistici se non disponiamo di corpora di grandi dimensioni (alcuni milioni di parole almeno) allineati o da allineare.
Se invece disponiamo di tali corpora è preferibile addestrare un sistema statistico a tradurre contenuti analoghi, tenendo però in considerazione che il sistema ottenuto sarà utilizzabile con buoni risultati solo su contenuti simili a quelli utilizzati per l'addestramento e non in modo generale.
Altro considerazione da fare è per le coppie di lingue per le quali non sono finora stati realizzati sistema di traduzione basati su regole. In questo caso l'elevato costo iniziale di sviluppo di un sistema basato su regole farà preferire la realizzazione di un sistema statistico."


5. È vero che la ricerca italiana, in questo settore, è molto avanti? E, oltre a Syntema, quali sono le società di punta a livello internazionale in questo settore?
"La ricerca italiana ha una lunga tradizione non solo nel campo della traduzione automatica ma del NLP (Natural Language Processing) in generale.
Tra l'altro l'aumento notevole dei contenuti disponibili su Web rende necessario l'uso di strumenti che non solo permettano di tradurre automaticamente questi contenuti, ma anche di ricercare in modo intelligente le informazioni utili, disperse nel mare delle informazioni disponibili (pensiamo ad esempio ai problemi di un servizio di Help Desk o Customer Care). Per raggiungere tale scopo sono necessari strumenti intelligenti in grado di "comprendere" il significato dei contenuti andando oltre la semplice ricerca di parole chiave.

In questo ambito, senza la pretesa di voler fare un elenco esaustivo, sono certamente da citare l'Istituto di Linguistica Computazionale "Antonio Zampolli" di Pisa e il Centro per la ricerca scientifica e tecnologica (ITC-irst) della Provincia Autonoma di Trento.
In ambito applicativo, aziende come la Synthema lavorano da oltre 15 anni in campi quali la traduzione automatica, analisi terminologica, Semantic Search, Knowledge Management, Language Intelligence e Web Sentiment & Web Analysis."


Per chi fosse interessato ad avere maggiori informazioni segnalo:
www.syntema.it
Lista di risorse sul linguaggio automatico
http://www.lai.com/temain.html

Rara foto di un traduttore automatico uscito dal portatile

Home Page | Chi siamo | Le risposte per i nostri clienti | Area traduttori | Privacy | Contatti | Mappa del sito


Menu di sezione:


Traduzioni economia, finanza, contabilità, bilanci | becca@andreabecca.it

Torna ai contenuti | Torna al menu