Bagaimana Shazam mengidentifikasi lagu dalam waktu kurang dari 10 detik?

Di masa lalu yang jauh, ketika kami mendengarkan lagu di radio dan menikmatinya, kami harus berharap bahwa penyiar akan berbicara nama artis atau lagu untuk mencari vinil dan mendengarkan sampai kami sakit. Hari ini, untungnya, cukup arahkan ponsel ke sumber lagu dan dalam waktu kurang dari 10 detik Anda bisa mendapatkan nama, artis, lirik dan banyak data lainnya! Tetapi bagaimana Shazam membuat pengakuan ini begitu cepat?

Agar ini terjadi, aplikasi perlu memiliki database yang benar-benar kuat, diperbarui setiap hari dengan musik dari berbagai wilayah di planet ini. Untuk setiap lagu, Shazam menciptakan semacam sidik jari pada grafik 3D. Gambar ini disebut spektogram dan merupakan kunci pengenalan musik.

Pada sumbu X tempo lagu dicetak, sedangkan pada Y direkam frekuensinya, sedangkan pada Z menandai intensitas. Dengan begitu Anda dapat mengubah lagu menjadi grafik yang dapat dipindai oleh aplikasi. Di bawah ini adalah representasi sederhana yang hanya menggunakan sumbu X dan Y, tetapi Anda sudah bisa mendapatkan ide tentang cara kerja program:

Grafik

Shazam

Frekuensi musik bervariasi bahkan di dalam lagu yang sama. Aplikasi, ketika merekam informasi awal, mencari titik tertinggi dari frekuensi ini, untuk membuat kecocokan untuk sisa grafik, yang terbentuk melalui waktu lagu.

Ketika pengguna mengarahkan aplikasi ke lagu yang ingin mereka ketahui lebih lanjut, program ini membuat grafik 3D yang sama dari rekaman 10 detik itu, memindai basis data untuk lagu yang cocok dengan titik yang persis sama, dan hanya itu! Keajaiban telah selesai!

Jika lagu tidak termasuk dalam database atau sumber rekaman terlalu berisik, itu tidak diidentifikasi oleh Shazam, dan cukup mengganggu bagi mereka yang mencari dan tidak bisa. Namun, ini semakin menurun.

Shazam

Pada awalnya, itu berbeda

Dan jika Anda berpikir bahwa Shazam mulai lucu sebagai aplikasi, Anda salah besar. Perusahaan ini didirikan pada tahun 1999, menawarkan layanan identifikasi musik pada tahun 2002 - Anda mungkin membayangkan bahwa broadband bahkan tidak begitu populer pada waktu itu, jadi bagaimana dengan smartphone dan sejenisnya ...

Pada periode ini, hanya pengguna di Inggris yang memiliki akses ke layanan, yang dilakukan melalui panggilan telepon. Seseorang harus memutar nomor 2580 dan meletakkan ponsel di dekat sumber suara. Panggilan itu otomatis: begitu Shazam mendengarkan musik, panggilan terputus, dan sesaat kemudian orang tersebut menerima pesan yang mengidentifikasi nama dan artis.