Fins no fa gaire, Google Translate (el traductor de Google) era el clar referent a l’hora de traduir qualsevol classe de text tant en dispositius mòbils com en PCs i portàtils connectats a Internet. No obstant això, a finals de l’any 2017 va aparèixer un competidor singular en aquest àmbit: DeepL.

 

Ambdós serveis són gratuïts i permeten la traducció de text entre diferents combinacions d’idiomes, i nosaltres hem volgut avaluar el seu comportament i característiques per valorar quin s’ajusta millor a cada necessitat.

 

La traducció ajudada per la intel·ligència artificial

Els motors de traducció d’aquests serveis tenen un fort component tecnològic. Google ja va anunciar el setembre de 2016 l’ús d’un sistema de traducció automàtic anomenat Google Neural Machine Translation (GNMTS) que està basat en les anomenades Xarxes Neuronals Recurrents (RNN).

 

 

 

 

Aquest sistema ha permès a Google poder millorar de forma constant la qualitat de les traduccions, ja que no només es tenen en compte les paraules o les frases, sinó també el context en el qual apareixen les paraules i frases i quines altres s’assemblen a elles.

 

Aquesta ha sigut la clau de la traducció humana i la traducció automàtica. De fet, Google ha renovat no fa gaire aquell motor amb l’anomenada Zero-Shot Translation i un nou sistema de representacions de vectors distribuïts en els que les frases a traduir s’anaven traduint entre diferents parells d’idiomes per combinar els resultats i veure i tots ells tenien sentit entre si.

El seu rival, DeppL, també utilitza sistemes d’intel·ligència artificial, en concret xarxes neuronals de convolució, una mica diferents de les recurrents.

 

En aquest servei l’empresa alemanya que el desenvolupa s’aprofita d’un altre component fonamental: el seu diccionari multiidioma, el conegut Linguee. Aquest projecte ha permès construir una base de dades enorme amb la que el traductor automàtic DeepL pot treballar per aconseguir resultats destacables en la traducció.

 

 

DeepL suporta menys idiomes, és més precís?

Una de les desavantatges clares de DeepL és el nombre de llenguatges suportats. Avui en dia DeepL compta amb suport per a 9 idiomes, mentre Google dóna suport a 103.

 

 

Aquesta desavantatge en quantitat sembla contrastar amb la seva avantatja en qualitat. Segons la pròpia empresa, les traduccions obtingudes per DeepL han sigut votades com les favorites en una avaluació a cegues realitzada per traductors humans professionals. Aquests van indicar que el servei de DeepL era superior al de les altres eines, com per exemple Google Translate (o altres com Microsoft Bing o el traductor de Facebook), amb un marge de 3 a 1.

 

No només aquests traductors professionals semblen preferir els resultats oferts per DeepL: també ho fa un banc de proves anomenat BLEU (PDF) que mesura la precisió de la traducció i que per exemple la traducció entre l’anglès i l’alemany va obtenir una puntuació de 31,1 punts davant dels 28,4 de Google Translate.

 

 

 

 

 

És realment difícil afirmar si un o un altre és millor, però és cert que en les nostres proves DeepL ens sorprèn des de que va aparèixer, ja que ofereix una traducció «més natural» que Google Translate.

 

Podem experimentar amb alguns exemples més o menys complexes. Un exemple especialment complicat és el d’aquell famós començament de l’obra magna de la literatura, «Don Quijote de la Mancha», de Miguel de Cervantes. En aquest inici podem llegir les paraules originals «En un lugar de la Mancha, de cuyo nombre no quiero acordarme, no ha mucho tiempo que vivía un hidalgo de los de lanza en astillero, adarga antigua, rocín flaco y galgo corredor»

 

 

 

 

 

Hem oferit el text en anglès de l’edició anglesa de Proyecto Gutenberg i ens hem trobat amb un resultat bastant diferent entre Google Translate i DeepL. Tal com es pot observar, cap dels dos ho fa especialment bé, encara que Google sí que tradueix amb més precisió el «vivió no hace mucho tiempo», pero DeepL tradueix millor aquell últim «galgo corredor» que s’assembla més a aquella immortal frase original.

 

Tot i això possiblement era una prova massa difícil per als motors. Provem amb un text menys complex: el començament de ‘Cien años de soledad’ de Gabriel García Márquez, també molt famós, que deia el següent: «Muchos años después, frente al pelotón de fusilamiento, el coronel Aureliano Buendía había de recordar aquella tarde remota en que su padre lo llevó a conocer el hielo».

 

 

 

 

Si fem servir la traducció que per exemple aprofitaven a la web dels Premis Nobel i la passem per ambdós traductors, el resultat és el de la imatge. La de DeepL es podria considerar lleugerament millor pel temps verbal (un ‘recordaría’ una mica més precís que ‘recordaba’) i també per la forma en què aquest últim expressa aquell «al enfrentarse» més literari en lloc de «cuando se enfrentaba».

 

Aquests dos texts són complicats, però si agafem exemples més quotidians d’un diari en anglès com per exemple The New York Times, podem escollir una notícia recent com aquesta i veure el resultat per part dels dos sistemes de traducció:

 

 

 

Podem observar una altra vegada com el traductor de DeepL és més natural en fer servir expressions com «consiguió un respiro» i no el «tuvo un respiro» de Google Translate, però sobretot en paraules com «en un partido repleto» i no en «en un juego lleno», que semblen deixar clar que DeepL és més precís a l’hora de reconèixer el context i les paraules adequades per l’àmbit que es tracta.

 

Si anem a una notícia tecnologia, podem posar com a exemple la de fa uns dies de The Verge en la que es parlava sobre la nova decisió de Tesla davant de la seva estratègia comercial i la cancel·lació del tancament de les seves botigues físiques.

 

 

 

 

En aquesta ocasió les coses estan menys clares i ambdues traduccions són bastant similars en la seva precisió. Potser la de Google és una mica més encertada gràcies a poder reconèixer que Model 3 és una marca comercial de Tesla i manté les majúscules, però per altra banda DeepL tradueix correctament la forma d’escriure el preu. Són petits detalls, i per traduccions més llargues poden determinar la confiança de l’usuari en aquests sistemes de traducció.

 

 

Quantitat o qualitat

Google és clarament superior a DeepL en el nombre d’idiomes suportats i en característiques útils i molt atractives, com la possibilitat de traduir pàgines web senceres (és suficient introduir la URL en el camp de traducció), una cosa que DeepL no permet de moment.

 

El traductor de Google guanya en quantitat, però sembla que perd en qualitat. En les comparacions realitzades en la traducció de l’anglès al castellà és una mica superior. Evidentment poden haver-hi casos en els quals no sigui així, i en qualsevol traducció automàtica sempre hi haurà errors importants per culpa de les limitacions d’aquests sistemes per reconèixer el context o la traducció més adequada segons la situació.

 

És aquí on la supervisió humana és important per aconseguir que la traducció automàtica es torni més precisa i guanyi qualitat. Tot i això, les dues propostes són fantàstiques pel seu caràcter gratuït -DeepL té una versió Pro amb algunes opcions interessants – i la seva facilitat d’ús i accés.

Leave A Comment