Kako funkcionira Googleova značajka Hum to Search

Sadržaj:

Kako funkcionira Googleova značajka Hum to Search
Kako funkcionira Googleova značajka Hum to Search
Anonim

Ključni podaci za van

  • Google je lansirao novi alat koji korisnicima omogućuje traženje pjesama pjevušenjem, pjevanjem ili zviždanjem.
  • Novi alat koristi strojno učenje za spajanje pjevušene pjesme s bazom podataka od više od pola milijuna pjesama koja se neprestano ažurira.
  • Korisnici Googlea pitaju koja se pjesma reproducira gotovo 100 puta svaki mjesec.
Image
Image

Google je pokrenuo novu značajku pod nazivom "Hum to Search" kako bi riješio frustrirajući problem: imati pjesmu koja vam je zapela u glavi i ne možete shvatiti kako se zove.

Ideja pjevušenja da bi se pronašla pjesma čini se nevjerojatno jednostavnom, pa zašto Google pokreće ovu značajku tek 2020.? Pa, pokazalo se da je prepoznavanje pjesama na ovaj način zapravo prilično komplicirano, djelomično zato što se naše pjevušene verzije obično prilično razlikuju od izvorne pjesme. U nedavnom postu na svom blogu o umjetnoj inteligenciji, Google objašnjava kako je upotrijebio strojno učenje da riješi ovaj problem i naposljetku pomogne ljudima da pronađu pjesmu pjevušeći, zviždukajući ili pjevajući melodiju čak i kada je njihova izvedba manje precizna.

"Naš fokus za Hum to Search je pomaganje ljudima da prepoznaju i pronađu glazbu koja im je zapela u glavi," rekao je Googleov glasnogovornik Lifewireu u e-poruci.

Samo počni pjevušiti

Korisnici Googlea pitaju koja se pjesma reproducira gotovo 100 milijuna puta svaki mjesec, Aparna Chennapragada, Googleova potpredsjednica i generalna direktorica potrošačke kupovine, rekla je u videu koji predstavlja nekoliko novih značajki pretraživanja. Sada postoji način da to saznate.

Značajka "Hum to Search" ugrađena je u Googleovu mobilnu aplikaciju, widget Google Search i Google Assistant. Da biste mu pristupili putem aplikacije, dodirnite ikonu mikrofona i recite "What's this song?" Odabir gumba "Traži pjesmu" također funkcionira.

Za ispravan rad značajka zahtijeva da pjevušite najmanje 10-15 sekundi. Korisnici Androida mogu pjevušiti kako bi pronašli pjesme na više od 20 jezika, dok na iPhone uređajima rade samo pjesme na engleskom. Alat ne može uvijek identificirati pjesmu odmah, ali kada to učini, rezultati su prilično dobri.

"Više od polovice pjesama širokog skupa varijabli (ton, visina, glasnoća itd.) prepoznaju naši algoritmi, ali naravno, točnost ovisi o kvaliteti pjevušenja, vrsti pjesmu i još mnogo toga," rekao je Googleov glasnogovornik Lifewireu u e-poruci. "Ali nakon što se prepozna, otprilike četiri od pet odgovora su točna."

No ovo nije prvi put da se pjevušenje koristi u aplikaciji za prepoznavanje glazbe. SoundHound nudi sličnu značajku, kao što je primijetio CNN Business, a dostupna je i na Androidu i iOS-u. Prema Googleovom glasnogovorniku, nova značajka ne dovodi u pitanje privatnost, niti "mijenja način na koji Google obrađuje interakcije temeljene na zvuku", rekli su Lifewireu u e-poruci.

Strojno učenje

Unatoč jednostavnosti koncepta, pjevušenje melodije da bi se pronašla studijska snimka tehnički je prilično teško. Postoji nekoliko razloga za to, objašnjava Christian Frank iz Google Researcha u postu na blogu od 12. studenog. Prije svega, pjevušena verzija pjesme može se uvelike razlikovati od stvarne snimke, što otežava njihovo usklađivanje. Dakle, iako Shazam i mnoštvo drugih aplikacija već postoje za prepoznavanje pjesme koju čujete u restoranu ili na drugom javnom mjestu, upotreba pjevušene melodije kao osnove za tu pretragu može biti zahtjevnija.

"Uz stihove, pozadinske vokale i instrumente, zvuk mjuzikla ili studijske snimke može se prilično razlikovati od pjevušeće melodije", piše Frank."Greškom ili namjerom, kada netko pjevuši svoju interpretaciju pjesme, visina tona, tonaliteta, tempo ili ritam često mogu malo ili čak značajno varirati."

Image
Image

Budući da se pjevušene verzije pjesama mogu toliko razlikovati od originala, Frank napominje da su mnoge prethodne metode zahtijevale usklađivanje nečijeg pjevušenja s verzijom pjesme koja ima samo melodiju ili pjesmu koja uključuje pjevušenje. Ovo je slučajeve korištenja u stvarnom svijetu učinilo izazovnim jer baze podataka s tim pjesmama mogu biti ograničene i potrebno ih je ručno ažurirati.

Google objašnjava da za značajku Hum to Search koristi modele strojnog učenja za pretvaranje zvuka u "slijed temeljen na brojevima" koji predstavlja melodiju pjesme - ono što kaže može se smatrati "otiskom prsta"."

Prilagođeniji korisniku

Upotreba strojnog učenja u Googleovoj značajci Hum to Search u konačnici čini alat puno lakšim za korištenje u stvarnom svijetu. Budući da Hum to Search odgovara pjevušenoj melodiji pretraživača sa stvarnom pjesmom, alat može raditi s novim pjesmama čim se objave umjesto baze podataka koja se stalno mora ažurirati pjevušenim verzijama svake pjesme. Osim toga, ne trebate savršenu visinu da biste ga koristili.

"Trenutni sustav postiže visoku razinu točnosti na bazi podataka pjesama koja sadrži više od pola milijuna pjesama koje neprestano ažuriramo," rekao je Google u svojoj objavi Hum to Search. "Ovaj korpus pjesama još ima prostora za rast kako bi uključio više od mnogih svjetskih melodija."

Preporučeni: