Publié le: 11/01/2023 @ 18:27:47: Par Nic007 Dans "Microsoft"
MicrosoftLes chercheurs de Microsoft ont récemment annoncé "VALL-E" , un nouveau modèle d'intelligence artificielle dédié à la synthèse vocale. Ce modèle, en effet, est capable de simuler efficacement la voix d'une personne après seulement 3 secondes d'écoute. Soit dit en passant, VALL-E conserve les caractéristiques, les inflexions et même le ton émotionnel de l'orateur. Le dernier projet de l'entreprise consiste notamment en un modèle de langage de codec naturel, basé sur une technologie appelée "EnCodec". En ce qui concerne le fonctionnement, contrairement à ce qui a été vu par le passé, ce nouveau modèle, dès qu'il entend la voix à répondre, génère des codes codec audio discrets grâce à "EnCodec" . De plus, VALL-E est également capable d'imiter l'environnement acoustique de l'échantillon audio. Bref, un pas en avant important a certainement été fait par rapport aux systèmes précédents. Cependant, comme cela arrive toujours, les nouvelles technologies pourraient également avoir des effets négatifs. Les chercheurs ont notamment mis en évidence la possible diffusion de phénomènes tels que le "voice identification spoofing" ou l'"usurpation d'identité" d'un locuteur spécifique :

"Étant donné que VALL-E pourrait synthétiser la parole tout en conservant l'identité du locuteur, cela pourrait poser des risques potentiels en cas d'utilisation abusive du modèle, comme usurper l'identification de la parole ou se faire passer pour un locuteur spécifique. Nous avons mené les expériences en supposant que l'utilisateur accepte d'être le locuteur cible dans la synthèse vocale. Lorsque le modèle est généralisé aux locuteurs invisibles du monde réel, il doit inclure un protocole pour s'assurer que le locuteur approuve l'utilisation de sa voix et un modèle de détection de la parole synthétisée." Enfin , plusieurs échantillons de parole synthétisés par VALL-E sont disponibles ici : https://valle-demo.github.io/
Envoyer une nouvelle à un ami
Sujet:
Email:
Texte:
 
Informaticien.be - © 2002-2024 AkretioSPRL  - Generated via Kelare
The Akretio Network: Akretio - Freedelity - KelCommerce - Votre publicité sur informaticien.be ?