Utiliser la Bible pour améliorer les traducteurs automatiques

Des chercheurs américains se sont appuyés sur les différentes versions du texte sacré pour mettre au point des traducteurs automatiques de style, destinés à modifier le registre d’un texte. Explication. 

En 1611, la Bible du roi Jacques fixa la norme des Écritures en anglais pour 300 ans. Ce volume, exposé au musée de la Bible (Washington), est l’un des deux seuls restants des premières éditions du Nouveau Testament de la Bible du roi Jacques.

Reverso, Bing Translator, DeepL ou l’emblématique Google traduction… Ces dernières décennies, les traducteurs automatiques ont connu un essor fulgurant. Les chercheurs en informatique tentent aujourd’hui d’aller encore plus loin.

Partant du postulat qu’il existe différents styles et niveaux de langage, et donc de multiples façons de transmettre un même message, ils essayent de mettre au point des outils qui, en conservant le texte dans la même langue, sont capables d’en modifier le registre (plus ou moins soutenu, courant ou familier). Ces « traducteurs automatiques de style » s’avèrent plus complexes à développer que les outils de traduction standards. En cause, l’énorme quantité de données qu’ils requièrent.

Des chercheurs américains du Dartmouth College ont donc eu une idée originale : utiliser l’un des textes les plus adaptés au monde, la Bible. Leur étude a été publiée dans la revue Royal Society open science en octobre 2018. Le texte sacré compte environ 31 000 versets, bien chapitrés et numérotés, ce qui permet aux algorithmes d’apprentissage automatique d’analyser une vaste base de données, en s’y repérant facilement. L’équipe a ainsi utilisé 34 versions de la bible, allant de la « King James version » (Bible du roi Jacques) du XVIIe siècle à des traductions contemporaines utilisant le registre courant.

Selon les auteurs, ce « traducteur automatique de style » mettra la lecture des monuments de la littérature à la portée de tous. Une œuvre comme « Moby Dick », roman de l’écrivain américain Herman Melville, paru en 1851, pourrait ainsi être adaptée aux jeunes lecteurs, à des personnes ayant un faible niveau de vocabulaire ou à tout autre public.

Source: National Geographic

Publicités

Commenter cet article

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l'aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s