À la fin de la Seconde Guerre mondiale, le premier ordinateur est mis au point. Mais il faudra attendre 1954 pour que la démo du premier système de traduction automatique voit le jour. En 1956, John McCarthy invente le terme « intelligence artificielle » bien que les premiers algorithmes fondés sur les réseaux neuronaux ne datent que des années 1980. Suite à cette avancée, la première mémoire de traduction est créée entre 1988 et 1994. En 1990, le web fait son apparition, et le web 2.0 en 2005.
En 1995, la plupart des technologies existaient déjà :
- La traduction automatique à base de règles comme Systran. Cependant, elle avait des limites à cause des ambiguïtés de sens.
- Les mémoires de traduction
- La traduction automatique à base de statistiques et de probabilité était un domaine de recherche.
- L’ordinateur devient incontournable. Le traducteur manipule un fichier et pas seulement un contenu cognitif. Des corpus de textes numériques voient également le jour.
- Internet devient « commercial » et donc grand public.
Jusqu’en 2016, il y avait surtout :
- Une diffusion des outils
- Une amélioration des techniques existantes
- Une amélioration des capacités des processeurs
- Des changements dans la profession et dans les processus
Mais l’intelligence artificielle, et en particulier les techniques basées sur les réseaux neuronaux sont en train de bouleverser notre environnement. Même si en réalité, les changements datent de 2014.
Google Translate et DeepL développent des systèmes de traduction automatique (TA) neuronaux (NMT) faisant appel au «deep learning».
En 2019, il y a de nombreuses améliorations techniques :
- Les ordinateurs plus puissants
- Les interfaces graphiques/tactiles
- Le traitement de la parole : dictée vocale et synthèse vocale (gsm, répondeur…)
https://www.acapela-group.com/ - Les traitements statistiques et probabilistes : traduction automatique (Google), saisie intelligente, détection de la langue, mémoires de traduction, alignement
- Le cloud/nuage
- Les corpus (monolingues, bilingues, multilingues, alignés ou non…)
- L’intégration des techniques :
- Les règles et les statistiques
- Les mémoires de traduction et la traduction automatique
- Les mémoires de traduction et l’analyse syntaxique (sous-segments)
- Les mémoires de traduction et la gestion de projet
- Internet :
- Une source de corpus
- Un moyen de communication (télétravail, équipes virtuelles, Big Data…)
- Les logiciels en ligne
- Crowdsourcing ou production participative
