Jesu li ovi super-impresivni glasovi AI audioknjiga dobri ili loši?

Sadržaj:

Jesu li ovi super-impresivni glasovi AI audioknjiga dobri ili loši?
Jesu li ovi super-impresivni glasovi AI audioknjiga dobri ili loši?
Anonim

Ključni podaci za van

  • DeepZen koristi AI (umjetnu inteligenciju) za stvaranje zapanjujuće realističnih audioknjiga od teksta.
  • Tehnologija koristi stvarne ljudske glasovne glumce kao građevne blokove.
  • Amazon i Audible trenutačno ne prihvaćaju računalno generirane audioknjige.
Image
Image

DeepZen je tvrtka koja stvara računalne glasove koji se koriste u audio knjigama, na temelju stvarnih glasova ljudskih glumaca. Kvaliteta je zastrašujuće - dovoljno dobra da je možete slušati satima. Trik je ovdje AI (umjetna inteligencija) komponenta, koja može pročitati tekst i zaključiti ispravnu emocionalnu reakciju na temelju konteksta. Zatim stavlja tu emociju u glas.

Impresivno je i vrlo praktično. No, želimo li doista homogenizirano iskustvo audio knjige? A što je s tim glasovnim glumcima?

"Iz perspektive indie izdavača, sve što smanjuje troškove proizvodnje audioknjiga vrlo je zanimljivo," rekao je Rick Carlile, vlasnik neovisnog izdavača Carlile Media, putem e-pošte za Lifewire.

"Ali ta privlačnost pretpostavlja da bi proizvod bio jednake kvalitete kao tradicionalna naracija. Mislim da još nismo sto posto stigli. Nemojte me krivo shvatiti, DeepZen je nevjerojatno dobar. To je ogroman napredak, a njegovi tvorci zaslužuju ogromne pohvale i uspjeh. Ali još nije savršen."

Audio koji je 'dovoljno dobar'

Najbolji način da shvatite kvalitetu DeepZen-a je poslušati uzorke. Ako niste znali da su računalno generirani, možda nećete ni shvatiti. Barem ne neko vrijeme. Pretpostavimo da je DeepZenova umjetna inteligencija savršena i da nikada pogrešno ne tumači emotivne note koje bi trebala pogađati.

Image
Image

Čak i tada, čovjek može ponuditi nijansiranija i često iznenađujuća tumačenja. Glumac bi mogao unijeti neočekivani zaokret u riječi koje računalo nikada ne bi ni uzelo u obzir. A u stvarnosti, AI interpretacija sigurno još nije tako dobra kao kod profesionalnog glasovnog glumca.

"Kao onaj koji radi na filmovima i nedavno u svijetu audio naracije, iako sam impresioniran AI-pouzdano znam da postoje duboke dubine značenja koje stroj ne može protumačiti, " profesionalni glas glumac Paul Cram rekao je Lifewireu putem e-pošte.

"Hoće li doći do navale nepoznatih autora koji će ga koristiti? Jamčim da hoće jer je 'dovoljno dobar'."

Biti dovoljno dobar, u kombinaciji s praktičnošću i uštedom troškova, može biti dovoljno da privuče nezavisne izdavače na uslugu.

"Audioknjige mogu koštati do 500 USD po gotovom satu zvuka (mnogo više za glas slavne osobe), a to ne uključuje troškove vremena upravljanja i administratora, " kaže Carlile. "Mogućnost prepoloviti taj trošak jednostavnim učitavanjem rukopisa dobavljaču kao što je DeepZen iznimno je privlačna."

Talking Trouble

Još nije tako jednostavno kao otpuštanje vaših glasovnih glumaca i učitavanje rukopisa u DeepZen. Trenutačno postoji jedna prepreka jednostavnom AI govoru audioknjiga, a to je Amazon.

Image
Image

"Trenutno ACX, put samoizdavača do distribucije audioknjiga Audible i Amazon, neće prihvaćati audioknjige koje čovjek nije snimio," kaže Carlile.

Zašto? Kvaliteta. Evo unosa FAQ s web stranice:

"Pretvorba teksta u govor ili druga automatizirana snimanja nisu dopuštena. Čujni slušatelji biraju audioknjige za izvođenje materijala, kao i priče. Da biste ispunili to očekivanje, vašu audioknjigu mora snimiti čovjek."

To znači da audioknjige koje je generirao DeepZen nisu dostupne, barem za sada. Ovo je čista spekulacija, ali DeepZen bi se činio kao prilično dobra akvizicija za Amazon, dopuštajući mu da proda uslugu i zadrži je samo za Audible knjige. A čak i ako se to ne dogodi, ako je kvaliteta računalno generiranih audioknjiga tako dobra, onda se čini da nema razloga da ne napravite iznimku od ovog pravila.

Biste li rado slušali ovako napravljene audioknjige? Kad se to dogodi, većina ljudi neće ni posumnjati. Neki bi možda više voljeli savršenstvo računalno generiranih glasova jer će biti oslobođeni vokalnih tikova i navika koje ponekad mogu omesti. Tehnologija je također prikladna za videoigre, TV i radio oglase i bilo koji drugi scenarij u kojem biste angažirali glasovnog glumca.

Tehnologija DeepZen također bi bila izvrstan način za automatsko stvaranje podcasta vijesti iz pisanih članaka, što bi moglo biti zgodno za putovanje na posao.

A što je s tim glasovnim glumcima? Pa, bit će barem jedna prilika: mogu otići i raditi za DeepZen.

Preporučeni: