Et av fokusområdene for teknologiselskapene er å gi de digitale stemmeassistentene et naturlig språk. Google har gjort formidable fremskritt på denne fronten, men også Apples Siri høres mindre robotaktig ut enn tidligere.
Vanskelig å høre forskjell
Tacotron 2 er tekst-til-tale-systemet til Google som leverer imponerende resultatet. Ikke bare er det vanskelig å skille mellom den kunstige intelligens og et menneske, den takler også komplekse ord, riktig uttalelse avhengig av innholdet, retting av små skrivefeil og hvilke ord det skal legges trykk på.
Systemet består av to dype, nevrale nettverk der ett av dem konverterer tekst om til et spesielt spektrogram, som du kan se i bildet øverst i denne saken, mens det andre, WaveNet, leser tabellen og gjør det om til en ekte stemme.
For øyeblikket fungerer Tacotron 2 kun med språket engelsk.
Annonse
Klarer du å høre hvilken stemme som er datagenerert? (Svaret er nummer to.)
Kilde:
Quartz
Annonse