Ključni podaci za van
- DALL·E je nova neuronska mreža koja može crtati slike na temelju teksta.
- Mreža je jedan od sve većeg broja AI projekata koji mogu oponašati kreativne rezultate ljudskih bića.
- Stručnjaci kažu da slike koje je nacrtala umjetna inteligencija nisu originalne kreacije.
Pomakni se, Picasso. Nova neuronska mreža može crtati slike na temelju teksta.
DALL·E, portmanteau imena umjetnika Salvadora Dalíja i Pixarovog WALL·E, može uzeti bilo koji tekst i stvoriti sliku od njega. Sustav koristi neuronsku mrežu koja je uvježbana na milijardama slika i tekstualnih primjera. To je jedan od sve većeg broja AI projekata koji mogu oponašati, ali ne i replicirati, kreativne rezultate ljudskih bića.
"Budući da se prirodni jezik neprestano razvija i vrlo ovisi o kontekstualnim nijansama, podučavanje stroja da razumije jezik dovoljno dobro da nacrta sliku vrlo je značajno postignuće, " Tamara Schwartz, profesorica kibernetičke sigurnosti na York College of Pennsylvania, rekao je u intervjuu e-poštom. "Zamislite policijskog crtača, to je rijedak talent, koji ima sposobnost stvoriti sliku na temelju opisa svjedoka."
Korištenje velikih podataka za proizvodnju slika
DALL-E kreirala je tvrtka OpenAI koja se bavi istraživanjem umjetne inteligencije i radi prikupljanjem golemih količina podataka s interneta. Podatke zatim obrađuje model prirodnog jezika i osposobljava za proizvodnju slika iz teksta. DALL-E radi slično nedavno objavljenom GPT-3, jezičnom modelu koji je stvorio OpenAI koji može biti upitan za generiranje originalnih tekstualnih odlomaka. GPT-3 je obučen korištenjem pola trilijuna riječi internetskog teksta i može proizvesti iznenađujuće realističan tekst.
Naučiti stroj da razumije jezik dovoljno dobro da nacrta sliku vrlo je značajno postignuće.
Michael Yurushkin, osnivač i tehnički direktor BroutonLaba, tvrtke za podatkovnu znanost, rekao je u intervjuu e-poštom da je DALL-E "jedan od rijetkih uspješnih pokušaja čovječanstva u oponašanju naše kreativnosti i mašte." Dodao je: "Lakše je shvatiti kako umjetna inteligencija predviđa nešto prolazeći kroz relevantne podatke, ali teže je razumjeti kako može generirati crteže iz stvari za koje nikad prije nije 'čuo'."
Schwartz pažljivo primjećuje da umjetna inteligencija ne stvara informacije, već radije uzima jezične podatke i pretvara ih u slike.
"Početna kreativnost dolazi od čovjeka koji je konstruirao zadatak", rekao je Schwartz. "Postoji nešto 'kreativnosti' od strane AI, jer eksperimentira s različitim kombinacijama podataka, a zatim odabire iz brojnih potencijalnih rezultata. Međutim, čovjek ispituje rezultate i uči AI kako odabrati iz mnogih kombinacija."
Robot detektivski posao?
Stroj može eksperimentirati s ovim podacima i kombinacijom objekata mnogo brže nego umjetnik. Schwartz je primijetio da bi DALL-E jednog dana mogao biti partner s detektivom koji pokušava rekonstruirati mjesto zločina kroz skicu, na temelju svjedočenja očevidaca.
"Dok svjedoci daju svoje izjave, računalo bi moglo uzeti te govorne informacije prirodnog jezika i stvoriti crtež scene, ili mnoge crteže scene," rekla je. "Ove bi se vizualizacije zatim mogle integrirati kako bi se stvorila preciznija slika izgubljenog dokaza. Ova bi se vizualizacija mogla obogatiti integriranjem prethodnih slika lokacije prije zločina."
Nekoliko drugih programa vođenih umjetnom inteligencijom može proizvesti umjetnost. Na primjer, Ai-Da koristi sustav robotske ruke i tehnologiju prepoznavanja lica uparenu s umjetnom inteligencijom za stvaranje umjetnosti. Sustav može analizirati sliku postavljenu ispred stroja, koja se unosi u algoritam za proizvodnju pokreta robotove ruke.
Međutim, ljudski umjetnici ne bi se trebali brinuti da će ih zamijeniti robotski gospodari, ustvrdio je Ahmed Elgammal, direktor Laboratorija za umjetnost i umjetnu inteligenciju na Sveučilištu Rutgers, u The New York Timesu prošle godine.
"Iako se definicija umjetnosti stalno razvija, ona je u svojoj srži oblik komunikacije među ljudima", napisao je. "Bez ljudskog umjetnika iza stroja, umjetna inteligencija ne može učiniti nešto više od igranja s oblikom, bilo da to znači manipuliranje pikselima na ekranu ili bilješkama na glazbenoj knjizi. Ove aktivnosti mogu biti privlačne i perceptivno intrigantne, ali nemaju smisla bez interakcije između umjetnik i publika."
Nakon što sam pogledao rad DALL-E-a, razumijem Elgammalovu poantu da slike stvorene umjetnom inteligencijom nisu umjetnost. S druge strane, bolji su od bilo koje umjetnosti koju bih mogao stvoriti. Dakle, stvarno, koja je razlika?