Ključni podaci za van
- Novi model strojnog učenja halucinira sliku izgleda rečenice u jeziku kako bi pomogao prijevod.
- Sustav umjetne inteligencije, nazvan VALHALLA, dizajniran je da oponaša način na koji ljudi percipiraju jezik.
- Novi sustav dio je rastućeg pokreta za korištenje umjetne inteligencije za razumijevanje jezika.
Ljudska metoda vizualizacije slika dok prevodi riječi mogla bi pomoći umjetnoj inteligenciji (AI) da vas bolje razumije.
Novi model strojnog učenja halucinira sliku kako rečenica izgleda u jeziku. Prema nedavnom istraživačkom radu, tehnika zatim koristi vizualizaciju i druge tragove kao pomoć pri prijevodu. Dio je rastućeg pokreta za korištenje umjetne inteligencije za razumijevanje jezika.
"Kako ljudi govore i pišu jedinstveno je jer svi imamo malo drugačije tonove i stilove," Beth Cudney, profesorica analitike podataka na Sveučilištu Maryville, koja nije bila uključena u istraživanje, rekla je za Lifewire u intervjuu e-poštom. "Razumijevanje konteksta je teško jer je kao da se bavite nestrukturiranim podacima. Ovdje je obrada prirodnog jezika (NLP) korisna. NLP je grana umjetne inteligencije koja se bavi razlikama u načinu na koji komuniciramo korištenjem strojnog razumijevanja čitanja. Ključna razlika u NLP-u, kao grana umjetne inteligencije, ne fokusira se samo na doslovna značenja riječi koje izgovorimo ili pišemo. Ona gleda na značenje."
Idi pitaj Alice
Novi AI sustav, nazvan VALHALLA, koji su kreirali istraživači s MIT-a, IBM-a i Kalifornijskog sveučilišta u San Diegu, dizajniran je da oponaša način na koji ljudi percipiraju jezik. Prema znanstvenicima, korištenje senzornih informacija, poput multimedije, uparenih s novim i nepoznatim riječima, poput kartica sa slikama, poboljšava usvajanje i zadržavanje jezika.
Ovi sustavi povećavaju snagu chatbota koji su trenutno samo obučeni i sposobni za određene razgovore…
Tim tvrdi da njihova metoda poboljšava točnost strojnog prijevoda u odnosu na prijevod samo teksta. Znanstvenici su koristili arhitekturu enkoder-dekodera s dva transformatora, vrstu modela neuronske mreže prikladnu za podatke ovisne o nizu, poput jezika, koji može obratiti pozornost na ključne riječi i semantiku rečenice. Jedan transformator stvara vizualnu halucinaciju, a drugi izvodi multimodalni prijevod koristeći izlaze iz prvog transformatora.
"U scenarijima stvarnog svijeta, možda nećete imati sliku u odnosu na izvornu rečenicu," Rameswar Panda, jedan od članova istraživačkog tima, rekao je u priopćenju za javnost. "Dakle, naša motivacija je u osnovi bila: umjesto korištenja vanjske slike tijekom zaključivanja kao ulaznih podataka, možemo li koristiti vizualnu halucinaciju - sposobnost zamišljanja vizualnih scena - za poboljšanje sustava strojnog prevođenja?"
Razumijevanje AI
Značajna istraživanja usmjerena su na unapređenje NLP-a, istaknuo je Cudney. Na primjer, Elon Musk je suosnivač Open AI-a, koji radi na GPT-3, modelu koji može razgovarati s čovjekom i dovoljno je pametan da generiše softverski kod u Pythonu i Javi.
Google i Meta također rade na razvoju konverzacijske umjetne inteligencije sa svojim sustavom pod nazivom LAMDA. "Ovi sustavi povećavaju snagu chatbota koji su trenutno samo obučeni i sposobni za određene razgovore, što će vjerojatno promijeniti lice korisničke podrške i službi za pomoć", rekao je Cudney.
Aaron Sloman, suosnivač CLIPr, tehnološke tvrtke za umjetnu inteligenciju, rekao je u e-poruci da veliki jezični modeli poput GPT-3 mogu učiti iz vrlo malo primjera obuke kako bi poboljšali sažetke teksta temeljene na ljudskim povratnim informacijama. Na primjer, rekao je, velikom jezičnom modelu možete dati matematički problem i tražiti od umjetne inteligencije da razmišlja korak po korak.
"Možemo očekivati da će se iz velikih jezičnih modela izvući bolji uvid i razmišljanje kako budemo učili više o njihovim mogućnostima i ograničenjima", dodao je Sloman. "Također očekujem da će ovi jezični modeli stvoriti procese sličnije ljudskim budući da modelisti razvijaju bolje načine za fino podešavanje modela za specifične zadatke od interesa."
Profesor računarstva Georgia Tech Diyi Yang predvidio je u intervjuu e-poštom da ćemo vidjeti više korištenja sustava za obradu prirodnog jezika (NLP) u našim svakodnevnim životima, u rasponu od personaliziranih pomoćnika temeljenih na NLP-u do pomoći s e-poštom i telefonskim pozivima, na obrazovane sustave dijaloga za traženje informacija na putovanju ili u zdravstvenoj skrbi."Kao i poštene AI sustave koji mogu obavljati zadatke i pomagati ljudima na odgovoran i nepristran način," dodao je Yang.
Ogromni AI modeli koji koriste trilijune parametara kao što su GPT-3 i DeepText nastavit će raditi prema jednom modelu za sve jezične aplikacije, predvidio je Stephen Hage, inženjer strojnog učenja u Dialexi, u intervjuu e-poštom. Rekao je da će također biti novih vrsta modela stvorenih za posebne namjene, kao što je kupnja putem interneta s glasovnim naredbama.
"Primjer bi mogao biti kupac koji kaže 'Pokaži mi ovo sjenilo u ponoćno plavoj boji s više aureole,' kako bi pokazao tu nijansu na očima osobe uz određenu kontrolu nad načinom na koji se nanosi," dodao je Hage.