Partager:

JAKARTA - En août dernier,Introduisant SeamlessM4T, un outil de traducteur basé sur l’intelligence artificielle (IA). Il a été lancé il y a seulement trois mois, Meta a annoncé son dernier modèle.

Meta a mis à jour SeamlessM4T et l’appelle une deuxième génération (V2). Le service dispose d’un outil de traducteur plus large car Meta combine deux nouvelles capacités.

La première capacité que Meta a ajoutée était SeamlessExpressive. L’outil peut inclure des expressions du haut-parleur telles que le murmurage, le triste et le plaisir à travers les interruptions, la vitesse de la parole, le style vocal et les tones émotionnels.

L’outil a été créé avec une combinaison d’un coder expression et un modèle de base de SeamlessM4T V2. Meta dit qu’ils ont remplacé le dispositif de traitement audio pour prendre en charge la capacité de lecture des expressions.

« Activiser les unités de capodryum HiFi dans SeamlessM4T v2 avec un générateur expresssif unité à parole conditionné dans le discours source permet un transfert sans contrainte de ton, d’expression émotionnelle et de style vocal », a déclaré Meta dans un communiqué.

La prochaine capacité que Meta a ajoutée est SeamlessStreaming, une introduite automatique de paroles pour la traduction de paroles en texte ou de paroles en paroles. Cet outil est présent avec une grande précision et une quarantaine atteint deux secondes.

Cette latence est inévitable car la structure de phrase par langue est différente. AI en SeamlessM4T doit apprendre ses entrées audio principales pour décider si les mots et les phrases écoutés doivent être traduits ou non.

« Cela se fait par le biais d’une politique de lecture ou d’écriture étudiée, qui détermine, sur la base des contributions audio partielles, si écrire et produire des produites ou lire en attendant d’autres contributions », a expliqué Meta.

Actuellement, SeamlessM4T V2 a pris en charge près de 100 langues pour la traduction par paroles en texte et 36 langues pour la traduction paroles en paroles. Ce service de traducteur a été formé avec 4,5 millions d’heures de données, de sorte qu’il y a des chances d’augmenter le niveau de la langue.

La nouvelle capacité de la série de communications sans heurts, un service de communication multilingue, pourrait être un concurrent des traducteurs développés par Google et Samsung. Cependant, on ne sait pas encore quand SeamlessM4T V2 sera accessible au public.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)