Une famille de modèles de synthèse vocale multilingue ultra-performants. Il supporte le clonage de voix en 3 secondes, le design de voix par description textuelle et une latence de streaming record de 97ms. Il gère 10 langues et plusieurs dialectes avec une expressivité émotionnelle naturelle.
Pourquoi cet outil change la donne :
-
Clonage instantané : Vous pouvez cloner n’importe quelle voix à partir d’un échantillon audio de seulement 3 secondes.
-
Voice Design : Au lieu de cloner, vous pouvez décrire la voix souhaitée (ex: “Une voix masculine profonde, calme, avec un léger accent britannique”) et l’IA la crée de toutes pièces.
-
Streaming Dual-Track : Grâce à son architecture innovante, il commence à parler presque instantanément (97ms), ce qui est idéal pour les assistants vocaux interactifs.
-
Multilingue natif : Supporte parfaitement le français, l’anglais, le chinois, le japonais, l’allemand, l’italien, le russe, le coréen, le portugais et l’espagnol.