Hlavná Inovovať Nová umelá inteligencia prevodu textu na reč spoločnosti Google je taká dobrá, že sa stavíme, že ju od skutočného človeka nerozoznáte

Nová umelá inteligencia prevodu textu na reč spoločnosti Google je taká dobrá, že sa stavíme, že ju od skutočného človeka nerozoznáte

Váš Horoskop Na Zajtra

Viete rozlíšiť medzi počítačovou rečou generovanou AI a skutočným živým človekom? Možno ste si vždy mysleli, že by ste mohli. Možno máte radi Alexu a Siri, ale verte, že by ste si nikdy nepomýlili ani jednu so skutočnou ženou.

Veci sa stanú oveľa zaujímavejšími. Inžinieri spoločnosti Google usilovne pracovali na vytvorení systému prevodu textu na reč s názvom Tacotron 2 . Podľa a papier publikovali tento mesiac, systém najskôr vytvorí spektrogram textu, vizuálne znázornenie toho, ako by mala reč znieť. Tento obrázok je prevedený prostredníctvom existujúceho algoritmu WaveNet spoločnosti Google, ktorý pomocou tohto obrazu vytvára mimoriadne prirodzene znejúcu ľudskú reč.

alex de target es gay

Pomocou tejto metódy vedci uviedli: „Náš model dosahuje priemerné skóre názoru (MOS) 4,53 porovnateľné s MOS 4,58 pre profesionálne zaznamenanú reč.“ (Priemerné skóre názoru je telekomunikačný výraz, ktorý meria, ako niečo znie reálne.)

Ako demonštrujú zvukové ukážky spoločnosti Google, Tacotron 2 dokáže z kontextu zistiť rozdiel medzi podstatným menom „desert“ a slovesom „desert“, ako aj podstatným menom „present“ a slovesom „present“, a podľa toho zmeniť jeho výslovnosť. Môže klásť dôraz na slová písané veľkými písmenami a pri vyslovení otázky použiť správne skloňovanie, a nie vyhlásenie.

A môže generovať text, ktorý znie tak podobne ako ľudská reč, že je ťažké alebo nemožné poznať rozdiel. Ak chcete zistiť, aké je to ťažké, navštívte stránku Google stránka so zvukovými ukážkami a posuňte sa nadol na poslednú skupinu vzoriek s názvom „Tacotron 2 alebo Human?“ Nájdete tam Tacotron 2 a skutočnú osobu, z ktorej každá hovorí vety ako: „To dievča urobilo video o rúži Hviezdnych vojen.“

VÝSTRAHA SPOILERA: Skôr ako si prečítate zvyšok tohto stĺpca, vypočujte si ukážky a hádajte, ktoré to sú.

Ktoré vzorky teda obsahujú prevod textu na reč a ktoré sú skutočným ľudským hlasom? Inžinieri spoločnosti Google nehovoria, ale zanechali veľmi veľkú stopu. Každá zo vzoriek súboru .wav má názov súboru, ktorý obsahuje buď výraz „gen“, alebo „gt“. Na základe tohto článku je vysoko pravdepodobné, že výraz „gen“ označuje reč generovanú programom Tacotron 2 a „gt“ je skutočná ľudská reč. („GT“ pravdepodobne znamená „základná pravda“, čo je výraz strojového učenia, ktorý v podstate znamená „skutočná dohoda“.)

Za predpokladu, že je to správne, tu sú odpovede na test:

¿Georgia Engel se casó alguna vez?

'To dievča natočilo video o rúži Hviezdnych vojen.'

Ukážka 1: Skutočný človek

Vzorka 2: Tacotron 2

„Získala doktorát zo sociológie na Kolumbijskej univerzite.“

Ukážka 1: Tacotron 2

Ukážka 2: Skutočný človek

„George Washington bol prvým prezidentom Spojených štátov.“

Ukážka 1: Tacotron 2

Ukážka 2: Skutočný človek

cuantos años tiene denise nicholas

'Som príliš zaneprázdnený romantikou.'

Ukážka 1: Skutočný človek

Vzorka 2: Tacotron 2

Koľko ste dostali správne? A mohli by ste skutočne rozlíšiť rozdiel, alebo ste len museli hádať?