microsoft vasa-1
Med et AI-generert portrett-bilde lager teknologien snakkende mennesker man må studere for å oppdage at ikke er ekte.

Annonse


Dette er laget med et bilde

Microsoft Research Asia har avslørt “VASA-1.”

Ikke en gang portrettene er ekte

Teknologien klarer å lage snakkende animasjoner! Ikke så imponerende i utgangspunktet, men når vi vet at det er mulig kun med et AI-generert portrett (unntaket er naturligvis Mona Lisa), da snakker vi. “TL;DR: enkeltportrettfoto + talelyd = hyperrealistisk snakkende ansiktsvideo med presis leppe-lydsynkronisering, naturtro ansiktsatferd og naturalistiske hodebevegelser, generert i sanntid,” oppsummerer Microsoft prosjektet som bemerker at det ikke er noen plan for å lansere et produkt og/eller API.

“VASA-1, er i stand til ikke bare å produsere leppebevegelser som er utsøkt synkronisert med lyden, men også fange et stort spekter av ansiktsnyanser og naturlige hodebevegelser som bidrar til oppfatningen av autentisitet og livlighet,” forklares det, etterfulgt av en rekke realistiske animasjoner på nettsiden:

Blir kanskje å finne i fremtidig Microsoft eller Xbox-spill

Forskningsgruppen sier at “gjennom omfattende eksperimenter, inkludert evaluering av et sett med nye beregninger, viser vi at metoden vår overgår tidligere metoder i ulike dimensjoner betydelig. Metoden vår leverer ikke bare høy videokvalitet med realistisk ansikts- og hodedynamikk, men støtter også nettgenerasjonen av 512×512 videoer med opptil 40 FPS med ubetydelig startforsinkelse. Det baner vei for sanntidsengasjementer med naturtro avatarer som etterligner menneskelig samtaleatferd.”

Verktøyene er gratis og utrolige

Annonse