Il est aujourd’hui difficile d’imaginer un monde où l’on entend une chanson sans pouvoir l’identifier immédiatement. Et pourtant, en 2002, l’idée de reconnaître un morceau simplement en tendant son téléphone vers une source sonore relevait presque de la science-fiction. L’histoire de Shazam, l’application pionnière de reconnaissance musicale, est un véritable récit de vision, de persévérance… et d’incrédulité.
Une idée trop en avance sur son temps
Tout commence en 1999 à Londres, où Chris Barton et Philip Inghelbrecht, deux entrepreneurs passionnés de musique, décident de relever un défi : permettre à n’importe qui d’identifier une chanson simplement en l’entendant dans un bar, un magasin ou à la radio. À l’époque, pas de smartphone, pas d’App Store, et très peu de puissance de calcul sur les téléphones mobiles.
Pour concrétiser leur idée, ils font appel à un ingénieur de génie : Avery Wang, titulaire d’un doctorat en traitement du signal de l’université de Stanford. Sa mission : développer un algorithme capable d’“écouter” quelques secondes d’un morceau, puis de le reconnaître instantanément dans une base de données, même s’il est diffusé dans un environnement bruyant. Le tout, avec les moyens technologiques de l’époque.
Lire aussi : Les meilleures applications pour créer de la musique
Shazam avant Shazam : quand on envoyait des SMS à un serveur
En 2002, l’application telle que nous la connaissons n’existe pas encore. Mais Shazam lance un service SMS révolutionnaire au Royaume-Uni. Le fonctionnement est étonnamment simple (et complexe à la fois) :
-
L’utilisateur appelle un numéro court, le 2580, et tient son téléphone vers la musique pendant environ 15 secondes.
-
L’appel enregistre l’extrait sonore et l’envoie à un serveur.
-
Quelques instants plus tard, l’utilisateur reçoit par SMS le titre et l’artiste de la chanson identifiée.
Aucune base de données sur le téléphone, pas d’interface, pas de visuel, juste de la technologie brute.
Un exploit technique dans un monde limité
À l’époque, les téléphones n’ont ni micro performant, ni connexion Internet rapide, ni capacité de stockage suffisante. Le système repose donc entièrement sur la qualité de l’algorithme d’analyse et de comparaison audio, hébergé sur des serveurs centralisés.
Avery Wang développe un système de reconnaissance basé sur les “empreintes digitales audio” (audio fingerprints), capable d’identifier une chanson même dans un environnement bruyant ou si l’enregistrement est partiel. Cette technologie, unique et inédite à l’époque, représente un exploit scientifique.
Le scepticisme des investisseurs
Malgré cette innovation majeure, les investisseurs sont très réticents. On est au début des années 2000, la bulle Internet vient d’éclater, et l’idée de créer un service musical complexe basé sur la reconnaissance audio automatique paraît farfelue.
On reproche à Shazam :
-
son modèle technique trop ambitieux ;
-
l’absence de marché de masse (les smartphones n’existent pas encore) ;
-
le coût important de l’infrastructure serveur.
La société peine à lever des fonds, et survit tant bien que mal grâce à un usage très limité au Royaume-Uni.
Le tournant : l’arrivée de l’iPhone
La révolution arrive en 2007 avec le lancement de l’iPhone. Et en 2008, Shazam devient l’une des toutes premières applications disponibles sur l’App Store. Cette fois, la technologie trouve enfin un support à la hauteur de ses ambitions.
L’expérience utilisateur est transformée : il suffit d’ouvrir l’application, d’appuyer sur un bouton, et le morceau est identifié en quelques secondes avec la jaquette de l’album, les paroles, et un lien pour l’écouter.
Succès immédiat. En quelques mois, Shazam devient l’une des applications les plus téléchargées au monde. Elle démocratise la reconnaissance musicale et inspire des générations d’apps dans d’autres domaines (plantes, objets, films…).
Et aujourd’hui ?
Shazam fait aujourd’hui partie intégrante de l’écosystème Apple, qui a racheté l’entreprise en 2018. Son algorithme reste l’un des plus précis du marché, et l’application continue d’évoluer.
Mais ses usages ne se limitent plus à l’identification de morceaux à la radio :
-
Dans les magasins, des systèmes utilisent Shazam pour analyser l’environnement sonore et adapter la publicité en temps réel.
-
Dans les campagnes marketing, des pubs TV ou radio intègrent des “sonic triggers” reconnus par Shazam pour lancer des offres spéciales.
-
Pour les artistes, la data récoltée par Shazam est un indicateur de popularité locale et un outil de prédiction pour les labels.
Shazam est bien plus qu’une application utile : c’est l’illustration parfaite d’une idée visionnaire réalisée envers et contre tout, grâce à la technologie, l’audace et une persévérance hors du commun. Ce que personne ne croyait possible en 2002 est devenu, vingt ans plus tard, un réflexe quotidien pour des centaines de millions de personnes.
Et tout cela, à partir d’un simple SMS.