Meta présente son interprète intelligent, développé en partie en Israël
Selon le titan de la technologie, c’est une "étape vers un avenir où l’interprétation simultanée sera possible" ; le centre de R&D de TLV fait partie du projet mondial de Meta AI
SAN FRANCISCO – Meta a annoncé cette semaine avoir mis au point un système d’interprétation vocale alimenté par l’intelligence artificielle (IA) capable de traduire vers l’anglais principalement des langues parlées qui ne disposent pas d’un système d’écriture très répandu, à commencer par le hokkien, une langue taïwanaise qui n’a pas de forme écrite standard.
Ce système est le résultat de recherches poussées menées par les équipes d’IA de Meta à travers le monde, notamment en Israël, où Meta a développé une importante activité de recherche et développement (R&D), la plus importante en dehors des États-Unis.
Le titan technologique de la Silicon Valley, propriétaire de Facebook, Instagram et WhatsApp, a présenté le travail effectué dans le cadre de son projet Universal Speech Translator comme un effort visant à permettre aux utilisateurs du monde entier de se rencontrer, quelle que soit la langue qu’ils parlent. Ce projet est l’un des deux premiers annoncés en février.
Le second projet, lié au premier, s’intitule « No Language Left Behind » (aucune langue n’est oubliée), dans le cadre duquel Meta affirme construire un nouveau modèle d’IA avancé qui « peut apprendre à partir de langues pour lesquelles il existe moins d’exemples d’entraînement, et que nous allons utiliser pour assurer des traductions de qualité professionnelle dans des centaines de langues, de l’asturien au luganda en passant par l’ourdou ».
Ces deux projets font partie du projet à long terme de Meta visant à créer des outils linguistiques et des systèmes de traduction automatique qui s’appliqueront à « la plupart des langues du monde ».
Lorsque Facebook s’est rebaptisé Meta il y a un an, le cofondateur et chef de la direction Mark Zuckerberg a déclaré que l’entreprise se concentrait sur le passage à une vie en ligne se déroulant dans des royaumes virtuels, un concept appelé le « métavers ».
« Les communications orales peuvent aider à faire tomber les barrières et à rapprocher les gens où qu’ils se trouvent – même dans le métavers », explique Meta dans une publication sur son blog.
Le nouveau système de traduction du hokkien a été présenté par Meta comme le premier « système de traduction de la parole à la parole développé pour une langue non écrite » alimenté par l’intelligence artificielle.
La technologie de traduction, qui, selon l’entreprise technologique, sera partagée pour être utilisée par d’autres, permettra à une personne parlant le Hokkien de converser avec une personne parlant l’anglais, mais seulement à raison d’une phrase complète à la fois, explique Meta.
Le géant technologique a déclaré que pour concevoir le système, il a utilisé une variété de méthodes pour surmonter le fait que la plupart des systèmes de traduction vocale reposent sur des transcriptions.
Étant donné que le hokiien n’a pas de système d’écriture, Meta a déclaré qu’elle a utilisé des traductions parole-parole qui se basent sur un texte d’une langue apparentée, dans ce cas le mandarin, et des traductions parole-unité qui produisent des sons acoustiques.
« Notre équipe a d’abord traduit les paroles en anglais ou en hokkien vers le texte mandarin, avant de les traduire en hokkien ou en anglais », a expliqué Juan Pino, l’un des chercheurs en IA de Meta, à VentureBeat. « Ils ont ensuite ajouté les phrases appariées aux données utilisées pour entraîner le modèle d’IA ».
Meta AI built the first speech translator that works for languages that are primarily spoken rather than written. We're open sourcing this so people can use it for more languages.
Posted by Mark Zuckerberg on Wednesday, October 19, 2022
Meta a déclaré que ce travail était un « pas vers un avenir où la traduction simultanée entre les langues sera possible. »
« Les techniques dont nous avons été les pionniers avec le Hokkien peuvent être étendues à de nombreuses autres langues non écrites et finiront par fonctionner en temps réel. »
Le hokkien est largement parlé au sein de la diaspora chinoise. Il est utilisé par 16 millions de personnes en Asie et est parlé par les trois quarts de la population de Taïwan, selon l’Institut national des langues et civilisations orientales.
Mais cette langue n’a pas de forme écrite standard, ce qui complique la conception de modèles d’IA capables d’interpréter ce qui est dit, selon Meta.
Plus de 40 % des 7 000 langues existantes dans le monde sont principalement parlées, et n’ont pas de forme écrite standard ou connue de tous, a déclaré l’entreprise technologique.
« À l’avenir, toutes les langues, qu’elles soient écrites ou non, pourraient ne plus être un obstacle à une bonne communication », a déclaré Meta.