Quand on interroge Douglas Eck sur les avancées dans la gestion du langage grâce à l’intelligence artificielle, il propose d’appuyer sur le bouton « sous-titres » de Meet, le service de visioconférence utilisé pour l’interview, en raison de l’épidémie de Covid-19. Les paroles de cet ingénieur américain venu à Paris travailler au siège français de Google s’affichent alors par écrit, en direct et sans erreur, sous la fenêtre où on le voit, casque sur la tête. Cette innovation, impensable il y a encore peu de temps, est aussi disponible sur la plupart des vidéos de YouTube, la filiale de Google. Ou sur le dictaphone de ses derniers téléphones, qui propose de transcrire automatiquement tous les enregistrements audio.
Ces nouvelles possibilités ne sont qu’un exemple des progrès effectués ces dernières années dans le « traitement du langage naturel » par les entreprises du numérique, et notamment les géants comme Google, Apple, Facebook ou Amazon (GAFA). Certaines de ces nouveautés sont déjà mises en pratique. D’autres sont à l’état de recherche, exposées dans les conférences annuelles de développeurs, comme Google I/O (qui a eu lieu du 18 au 20 mai) ou Facebook F8 (le 2 juin).
Dans le domaine crucial de la traduction, les services comme Google Translate, qui a élargi son offre à 104 langues, ou de l’allemand DeepL permettent désormais de traduire des paragraphes entiers de façon cohérente et fluide. Grâce à ces avancées, Google propose de traduire les sous-titres des vidéos YouTube.
20 milliards de traductions par jour sur Facebook
Facebook aussi a beaucoup progressé. L’intelligence artificielle génère sur le réseau social 20 milliards de traductions par jour (plusieurs dizaines de langues, dont le wolof, sont disponibles), contre seulement 6 milliards en 2019… « Ce domaine est très important pour Facebook. Et nous savons que des traductions simultanées en temps réel vont être possibles », explique le Français Yann LeCun, directeur scientifique de Facebook et pionnier de l’intelligence artificielle.
Le rêve d’une machine traduisant les conversations en direct serait accessible. Google Translate s’en approche en léger différé : on peut parler dans une langue et faire entendre ou faire lire la traduction à son interlocuteur par le biais d’un smartphone, et même écouter sa réponse traduite dans des écouteurs, si ce sont les derniers modèles maison.
Les barrières entre le texte et l’image s’estompent. Avec l’application de réalité augmentée Google Lens, des élèves peuvent, à l’aide de leur smartphone, scanner une page de manuel ou une phrase écrite à la main et les traduire ou obtenir des informations complémentaires en ligne. Un touriste peut, lui, comprendre un panneau ou un menu, se renseigner sur un monument…
Il vous reste 73.14% de cet article à lire. La suite est réservée aux abonnés.