Ključni podaci za van
- Nove tehnologije mogle bi dovesti do računala koja bolje razumiju ljudski govor.
- Microsoft i NVIDIA nedavno su najavili novu metodu tumačenja jezika vođenu umjetnom inteligencijom.
- Kvantno računalstvo moglo bi biti još jedan način da se unaprijedi polje obrade jezika.
Danas postoji mnogo pametnih naprava za davanje naredbi, ali još smo daleko od računala koja razumiju konverzacijski govor.
Microsoft i NVIDIA nedavno su najavili novu AI-vođenu metodu za tumačenje govora koja bi mogla promijeniti način na koji razgovaramo s našom elektronikom. To je dio rastućeg pokreta koji mijenja način na koji računala razumiju govor, a naziva se i obrada prirodnog jezika (NLP).
"Modeli koji pokreću NLP postaju sve veći i napredniji i sve bliže ljudskom razumijevanju," stručnjak za umjetnu inteligenciju Hamish Ogilvy rekao je Lifewireu u intervjuu e-poštom.
"Jedan od velikih napredaka je taj što NLP ide dalje od jednostavnih ključnih riječi. Možda ste danas navikli upisivati ili izgovarati jednu ili dvije ključne riječi kako biste dobili rezultate pretraživanja, ali noviji modeli obrade prirodnog jezika koriste kontekst za pružanje bogatijih rezultata."
Chat roboti
NVIDIA i Microsoft udružili su se kako bi stvorili Megatron-Turingov model generiranja prirodnog jezika (MTNLG), za koji dvojac tvrdi da je "najmoćniji monolitni transformatorski model jezika koji je treniran do sada." AI model radi na superračunalima.
Ali istraživači su otkrili da je MTNLG model pokupio ljudske predrasude dok je pročešljavao brda uzoraka ljudskog govora.
"Iako divovski jezični modeli unapređuju stanje umjetnosti u stvaranju jezika, oni također pate od problema kao što su pristranost i toksičnost", napisali su istraživači u postu na blogu. "Naša zapažanja s MT-NLG-om su da model preuzima stereotipe i pristranosti iz podataka na kojima je obučen."
Računala koja bolje razumiju govor neće samo poboljšati pametne zvučnike poput Alexe, tvrdi Ogilvy. Web stranice za pretraživanje temeljene na tekstu kao što je Amazon također će bolje razumjeti upite koji se upisuju.
"Google je ovdje imao očito vodstvo, ali NLP tehnologija bit će posvuda", rekao je Ogilvy. "Za pretraživanja temeljena na tekstu i glasu, korisnici mogu bolje opisati jer NLP razumije više od teksta; on razumije kontekst onoga što tražite kako bi vam vratio bolje rezultate."
Quantum Chatovi?
Kvantno računalstvo moglo bi biti jedan od načina da se unaprijedi polje NLP-a. U srijedu je tvrtka Cambridge Quantum najavila lambeq, za koji tvrdi da je prvi kvantni alat za NLP.
…NLP razumije više od teksta; razumije kontekst onoga što tražite kako bi vratio bolje rezultate.
Tvrtka kaže da alat omogućuje prevođenje rečenica na prirodne jezike pomoću kvantnih sklopova koji se pokreću na kvantnim računalima. Kvantno računalstvo je vrsta izračuna koja koristi neobična svojstva kvantnih stanja, kao što su superpozicija, interferencija i isprepletenost, za izvođenje izračuna.
"Način na koji kvantna računala rukuju NLP-om jako se razlikuje od klasičnih strojeva. Zapravo, NLP je 'kvantno izvorni'", rekao je Bob Coecke, glavni znanstvenik u Cambridge Quantumu, za Lifewire u intervjuu e-poštom. "To je zbog otkrića koje smo došli prije nekoliko godina, da gramatika koja upravlja rečenicama i značenjem ima strukturu vrlo sličnu matematici koja se koristi za programiranje kvantnih računala."
Coecke je rekao da bi kvantni NLP mogao dovesti do boljih glasovnih pomoćnika i alata za prevođenje.
Još jedan obećavajući pristup poboljšanju prepoznavanja govora, koji se zove Zac Liu, podatkovni znanstvenik u tvrtki Hypergiant, rekao je Lifewireu u intervjuu e-poštom. "Ukratko, kada znanstvenici poboljšaju NLP podatke, to gotovo jamči da će imati bolji NLP model i bolje NLP mogućnosti."
Sljedeći korak je integracija modela računalnog vida s NLP-om, poput osposobljavanja AI modela za gledanje videa i izradu tekstualnog sažetka tog videa, rekao je Liu.
"Primjena ovog napretka mogla bi biti neograničena, od zdravstvene zaštite, čitanja radioloških filmova i pružanja preliminarne dijagnoze, do dizajniranja domova, odjeće, nakita ili sličnih predmeta", dodao je. „Klijent može objasniti zahtjeve usmeno ili u pisanom obliku, a ovaj opis se može automatski pretvoriti u slike ili video radi bolje vizualizacije."