Kako lahko Shazam v manj kot 10 sekundah prepozna skladbo?

V daljni preteklosti, ko smo na radiu poslušali pesem in uživali, smo morali upati, da bo izdajatelj izgovoril ime izvajalca ali skladbo, da bo iskal vinil in poslušal, dokler nismo zboleli. Danes na srečo telefon samo usmerite na vir skladbe in v manj kot 10 sekundah lahko dobite ime, izvajalca, besedila in številne druge podatke! Toda kako lahko Shazam tako hitro prizna to priznanje?

Da bi se to zgodilo, mora aplikacija imeti resnično močno bazo podatkov, ki jo vsak dan posodabljajo z glasbo iz različnih regij planeta. Shazam za vsako skladbo ustvari nekakšen prstni odtis na 3D grafiki. Ta slika se imenuje spektogram in je ključ do prepoznave glasbe.

Na osi X je natisnjen tempo skladbe, na Y pa je zapisana njegova frekvenca, na Z pa intenziteta. Tako lahko pesem pretvorite v grafiko, ki jo je mogoče skenirati. Spodaj je preprosta predstavitev, ki uporablja samo osi X in Y, vendar že lahko dobite predstavo, kako program deluje:

Graf

Shazam

Glasbena frekvenca se razlikuje tudi znotraj iste skladbe. Aplikacija pri snemanju začetnih informacij išče najvišjo točko te frekvence, da ustvari ujemanje za preostali del grafa, ki se oblikuje skozi čas skladbe.

Ko uporabnik aplikacijo usmeri na skladbo, o kateri želi izvedeti več, program ustvari tisti isti 3D-graf iz tega 10-sekundnega snemanja, pregleda bazo podatkov za skladbe, ki ustrezajo popolnoma enakim točkam, in to je to! Čarovnija je končana!

Če pesem ni vključena v bazo podatkov ali je vir snemanja preveč hrupno, Shazam ne prepozna in je precej moteč za tiste, ki so iskali in niso mogli. Vendar se to čedalje bolj zmanjšuje.

Shazam

V začetku je bilo drugače

In če menite, da se je Shazam kot aplikacija začel simpatično, se precej motite. Podjetje je bilo ustanovljeno leta 1999 in je leta 2002 ponujalo storitev prepoznavanja glasbe - morda si predstavljate, da takrat niti širokopasovna povezava ni bila tako priljubljena, kaj pa pametni telefoni in podobno ...

V tem obdobju so imeli dostop le do storitve v Angliji, ki je bila opravljena s telefonskim klicem. Eden je moral poklicati 2580 in mobitel postaviti v bližini vira zvoka. Klic je bil samodejen: takoj ko je Shazam poslušal glasbo, je klic prekinil, trenutek pozneje pa je oseba prejela sporočilo, v katerem je bilo navedeno ime in izvajalec.