Partager:

Service de traduction de texte de Microsoft adoptant la technologie d’IA, Microsoft Translator prend actuellement en charge plus de 100 langues et dialectes différents.

Avec 12 nouvelles langues supplémentaires, dont le géorgien, le macédonien, le tibétain et l’ouïghour, Microsoft affirme que Translator peut désormais créer du texte et des informations dans des documents accessibles à 5,66 milliards de personnes dans le monde.

En effet, Microsoft n’est pas le premier à avoir 100 langues dans ses outils de traduction. Auparavant, il y avait un concurrent Google Translate qui a atteint ce jalon pour la première fois en février 2016.

Cependant, ce qui le rend différent de Google, Microsoft a déclaré que le nouveau langage est pris en charge par des avancées uniques en matière d’IA et sera disponible dans les applications Translator, Office et Translator pour Bing, ainsi que dans Azure Cognitive Services Translator et Azure Cognitive Services Speech.

« Une centaine de langues est une bonne étape pour nous. Nous pouvons tirer parti (des similitudes entre les langues) et les utiliser pour améliorer la famille de langues dans son ensemble », a déclaré Xuedong Huang, directeur de la technologie (CTO) de Microsoft Azure AI.

La technologie d’IA de Translator est prise en charge par Z-code, qui fait partie de l’initiative de code XYZ de Microsoft visant à incorporer des modèles d’IA pour le texte, la vision, l’audio et le langage afin de créer des systèmes d’IA capables de parler, de voir, d’entendre et de comprendre.

Z-code fournit des frameworks, des architectures et des modèles pour la traduction textuelle multilingue de l’IA pour l’ensemble de la famille linguistique. En raison du partage d’éléments linguistiques dans des langues similaires et du transfert de l’apprentissage, qui applique les connaissances d’une tâche à l’autre, Microsoft affirme avoir réussi à améliorer la qualité et à réduire les coûts de ses capacités de traduction automatique.

Avec Z-code, Microsoft utilise l’apprentissage par transfert pour aller au-delà des langues les plus courantes et améliorer la précision de la traduction pour les langues de faible puissance, qui se réfèrent aux langues dont les données d’entraînement sont inférieures à 1 million de phrases.

Environ 1 500 langues sont connues pour répondre à ces critères, c’est pourquoi Microsoft a développé un processus de formation à la traduction multilingue qui combine une famille de langues et un modèle linguistique.

Le modèle de langage Z-code est formé multilinguement dans de nombreuses langues, et ces connaissances sont transférées entre les langues. En août, Microsoft a déclaré qu’un modèle de code Z avec 10 milliards de paramètres pourrait obtenir des résultats de pointe sur les tâches de traduction automatique et d’optimisation inter-langues.

Pendant ce temps, Google utilise également des techniques d’IA pour améliorer la qualité de la traduction linguistique dans l’ensemble de ses services. Pour ne pas être en reste, Facebook a récemment révélé un modèle qui utilise une combinaison de traduction mot à mot et de traduction inverse pour surpasser le système pour plus de 100 paires de langues. Microsoft, pour sa part, souligne l’attrait du traducteur comme preuve de la sophistication de la plate-forme.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)