Meta Ai avslører teknologi som kan lage stemmer på seks språk.
For overbevisende
Og det eneste AI-en trenger er kun to sekunder med tale-opptak fra et menneske for å kopiere det. Metas håp er at det i fremtiden kan hjelpe til med å servere naturlige og autentiske oversettelser på direkten, men at teknologien er så imponerende at det også ligger til en fare for misbruk: «…den potensielle risikoen for misbruk betyr at vi ikke offentliggjør koden eller Voicebox-modellen for øyeblikket.»
Tjenesten takler engelsk, fransk, tysk, spansk, polsk og portugisisk.
Metas AI-forskere har oppnådd et gjennombrudd innen generativ AI for tale. Vi har utviklet Voicebox, den første modellen som kan generalisere til talegenereringsoppgaver den ikke er spesifikt opplært til å utføre, og det med toppmoderne ytelse.
Meta
Om demo-klippet under forklarer Meta:
«Etter å ha lært av ulik offentlig informasjon på nett kan Voicebox generere tale som er mer representativ for hvordan folk snakker i den virkelige verden og på tvers av de seks støttede språkene. I fremtiden kan denne funksjonen brukes til å generere syntetiske data for å hjelpe til med å trene en taleassistentmodell bedre.
Resultatene våre viser at talegjenkjenningsmodeller trent på Voicebox-generert syntetisk tale yter nesten like godt som modeller trent på ekte tale, med en prosent feilrate degradering i motsetning til 45 til 70 prosent degradering med syntetisk tale fra tidligere tekst-til-tale-modeller.»


