Det nevrale nettverket leser et slikt spektrogram.
Det nevrale nettverket leser et slikt spektrogram.

Annonse


Hører du forskjell? Google-AI-en snakker som et menneske

Et av fokusområdene for teknologiselskapene er å gi de digitale stemmeassistentene et naturlig språk. Google har gjort formidable fremskritt på denne fronten, men også Apples Siri høres mindre robotaktig ut enn tidligere.

Vanskelig å høre forskjell

Tacotron 2 er tekst-til-tale-systemet til Google som leverer imponerende resultatet. Ikke bare er det vanskelig å skille mellom den kunstige intelligens og et menneske, den takler også komplekse ord, riktig uttalelse avhengig av innholdet, retting av små skrivefeil og hvilke ord det skal legges trykk på.

Systemet består av to dype, nevrale nettverk der ett av dem konverterer tekst om til et spesielt spektrogram, som du kan se i bildet øverst i denne saken, mens det andre, WaveNet, leser tabellen og gjør det om til en ekte stemme.

For øyeblikket fungerer Tacotron 2 kun med språket engelsk.

Annonse


Klarer du å høre hvilken stemme som er datagenerert? (Svaret er nummer to.)

 

Kilde:
Quartz

Annonse