Ključni podaci za van
- Novi kolektiv programera gradi AI modele otvorenog koda.
- Grupa koristi masivne modele učenja jezika koje će objaviti pod otvorenim licencama.
- Open-source AI mogao bi pomoći da snaga nove tehnologije koja potencijalno mijenja igru bude manje sklona pristranostima i pogreškama.
Velike tvrtke (AI) provode mnogo istraživanja o umjetnoj inteligenciji, ali jedna online grupa želi demokratizirati proces.
EleutherAI nedavno je osnovan kolektiv volontera istraživača, inženjera i programera usmjerenih na istraživanje umjetne inteligencije otvorenog koda. Organizacija koristi baze kodova GPT-Neo i GPT-NeoX za obuku masivnih jezičnih modela koje planira izdati pod otvorenim licencama.
"Podaci otvorenog koda koriste istraživačima jer znanstvenici imaju više besplatnih resursa za korištenje za treniranje modela i dovršetak istraživanja", rekao je Edward Cui, izvršni direktor AI tvrtke Graviti, u intervjuu e-poštom za Lifewire. Njegova tvrtka nije uključena u EueutherAI. "Znamo da su brojni projekti umjetne inteligencije bili zaustavljeni općim nedostatkom visokokvalitetnih podataka iz stvarnih slučajeva upotrebe, stoga je ključno uspostaviti smjernice koje osiguravaju kvalitetu podataka, uz pomoć zajednice koja sudjeluje."
Ovo je put
Počeci EleutherAI bili su skromni. Prošle godine, neovisni istraživač umjetne inteligencije po imenu Connor Leahy objavio je sljedeću poruku na poslužitelju Discorda: "Hej ljudi, neka [SIC] da OpenAI-ju da trči za svoj novac kao u dobra stara vremena."
I tako je nastala grupa. Sada ima stotine suradnika koji objavljuju svoj kod na mrežnom softverskom repozitoriju GitHub.
Nastojanja AI-ja otvorenog koda nisu nova. Zapravo, Airbnbova Airflow platforma za upravljanje tijekovima rada i Lyftov mehanizam za otkrivanje podataka rezultat su korištenja alata otvorenog koda koji timovima za podatke omogućuju bolji rad s podacima, istaknuo je Ali Rehman, voditelj projekta softverske tvrtke CloudiTwins u intervjuu e-poštom za Lifewire.
"Baš kao što je revolucija otvorenog koda dovela do transformacije razvoja softvera, tako je također pokretala razvoj i demokratizaciju znanosti o podacima i umjetne inteligencije", rekao je Rehman. "Otvoreni kod je postao ključni pokretač rješenja za podatkovnu znanost u poduzećima, a većina podatkovnih znanstvenika koristi alate otvorenog koda."
Otvaranje vrata
Razvoj umjetne inteligencije otvorenog koda mogao bi pomoći da snaga nove tehnologije koja potencijalno mijenja igru bude manje sklona pristranostima i pogreškama, tvrde neki promatrači.
Istraživanje umjetne inteligencije sada se primarno odvija na otvorenom, s gotovo svim tvrtkama, istraživačkim laboratorijima i sveučilištima koji svoje rezultate odmah predstavljaju u znanstvenim publikacijama, rekao je Kush Varshney, istraživač umjetne inteligencije u IBM-u, za Lifewire u intervjuu e-poštom.
"Ova otvorena zajednica je ključna jer pruža poboljšane razine provjere i ravnoteže kako bi se osiguralo da se AI istražuje, stvara, implementira i primjenjuje na odgovoran način", dodao je Varshney. "Ovo je posebno kritično u situacijama u kojima ti sustavi mogu utjecati na živote naših najranjivijih članova društva. Ova se otvorenost odnosi ne samo na opće strojno učenje i algoritme dubinskog učenja, već i na elemente pouzdane umjetne inteligencije."
Rehman je rekao da je jedna od ključnih razlika između vlasničkog i otvorenog softvera fleksibilnost i prilagodba. Vlasničko istraživanje umjetne inteligencije imat će problema sa sigurnošću, ažuriranjima i optimizacijama.
"To je zato što open-source pristup temeljen na zajednici dobiva vrijedne podatke od tisuća stručnjaka iz industrije koji identificiraju potencijalne sigurnosne ranjivosti koje se zatim brže otklanjaju", dodao je Rehman."Konsenzus zajednice znači da je kvaliteta zajamčena i da se nove prilike lakše identificiraju."
Još jedan problem je taj što vlasnička istraživanja umjetne inteligencije neće biti interoperabilna, što znači da ne mogu raditi s različitim formatima podataka i vjerojatno će imati zaključavanje dobavljača, što sprječava tvrtke da testiraju i isprobaju softver prije nego što se obvežu na rješenje, Rehman je rekao.
Ali ne mora svaki aspekt istraživanja umjetne inteligencije biti otvorenog koda, rekao je Chris Kent, izvršni direktor medicinske AI tvrtke Reveal Surgical, za Lifewire u intervjuu e-poštom. "Važno je zaštititi ekonomske poticaje koji pokreću komercijalni razvoj ključnih aplikacija umjetne inteligencije", rekao je.
Međutim, istraživanje umjetne inteligencije treba robusnu komponentu otvorenog koda, rekao je Kent. Dodao je da otvoreni kod radi na izgradnji povjerenja i korištenju skupova podataka koji nisu ili ne bi trebali biti pod kontrolom pojedinačnih institucija ili tvrtki.
"Pristup otvorenog izvornog koda najbolji je način da se identificiraju i kompenziraju temeljne pristranosti koje mogu postojati u setovima za obuku i dovest će do holističkijih, kreativnijih i pouzdanijih primjena umjetne inteligencije", rekao je Kent.