Comment fonctionnent les applications d’identification musicale comme Shazam?

Les applications d’identification musicale semblent magiques au début, mais sous le capot se trouve un algorithme sophistiqué qui peut trouver des chansons en un instant. Voici comment ils fonctionnent.

La magie de l’identification musicale

C’est probablement arrivé à nous tous. Vous dînez dans un bon restaurant, vous traînez dans un café ou vous vous promenez dans un magasin, lorsque vous entendez soudainement une bonne chanson dans les haut-parleurs. C’est peut-être une chanson que vous avez déjà écoutée ou une piste que vous n’avez jamais entendue. Donc, vous sortez votre téléphone, ouvrez Shazam et tenez votre appareil au plafond. En un éclair, l’application vous indique ce qu’est la chanson, qui est l’artiste et où la diffuser.

Ils sont rapides, remarquablement précis et peuvent identifier même les chansons les plus obscures. En un mot, ils travaillent en isolant la chanson d’un enregistrement et en la recherchant dans une vaste base de données de pistes. Mais la technologie derrière la façon dont ils font cela est assez complexe et impressionnante.

Vous serez peut-être choqué de savoir que l’application Shazam que nous connaissons aujourd’hui a été lancée en 2002, et que le système était tout aussi précis et rapide qu’à l’époque. Tout cela grâce à un algorithme unique qui révolutionnerait le monde de la musique.

  Comment résoudre les problèmes d'impression dans Microsoft Word

Ce n’est pas seulement les paroles

À première vue, les applications d’identification musicale comme Shazam peuvent sembler simples. Vous pourriez penser qu’ils écoutent simplement les paroles, comme n’importe quel assistant vocal, et les recherchent dans une base de données de paroles de chansons pour vous dire ce qu’est la chanson.

Cependant, la plupart des applications d’identification musicale sont capables de dire quel est le titre d’un instrumental, ou même le chanteur d’une chanson de couverture. En effet, au lieu d’analyser les paroles de la piste, ils recherchent des «empreintes digitales» propres à chaque chanson dans leurs vastes bases de données.

Technologie d’empreinte digitale

Shazam sur un iPhone X

Vous avez probablement des appareils qui peuvent être déverrouillés à l’aide de votre empreinte digitale, qui est la disposition des petites lignes sur votre doigt qui vous sont uniques. De même, lorsque vous maintenez votre microphone pour enregistrer un bref extrait d’une chanson, ce clip est transformé en modèles de données que Shazam ou une autre application peut rechercher dans leur base de données.

À première vue, cette méthode semble sujette à plusieurs problèmes. La plupart du temps que vous entendez de la musique en public, il y a un bruit de fond et une distorsion causés par les haut-parleurs, ce qui peut rendre les chansons non identifiables ou entraîner des correspondances inexactes. De plus, il y a beaucoup de données capturées même dans un bref clip audio, ce qui peut ralentir la recherche de ces modèles dans une base de données de millions de chansons.

  Comment utiliser l'autocollant de chat Instagram

Dans une interview avec Américain scientifique en 2003, Avery Li-Chun Wang, le scientifique en chef des données et co-fondateur de Shazam, explique comment leur algorithme résout ces problèmes. Les informations d’un clip audio peuvent être visualisées avec un graphique 3D connu sous le nom de spectrogramme, qui représente un changement de fréquences sur une période de temps. Il prend également en compte l’amplitude, c’est-à-dire la force d’un son. Ceci est représenté dans un spectrogramme utilisant l’intensité de la couleur.

Spectrogramme de musique Shazam

De la même manière que les humains ne peuvent pas percevoir le son à moins d’être à une fréquence particulière, au lieu de prendre en compte l’intégralité d’une chanson lors d’une recherche, Shazam ne prend en compte que les «pics», qui est le contenu énergétique le plus élevé d’un clip audio . Les empreintes digitales capturées ne prennent que les points de fréquence les plus élevés dans un laps de temps donné, puis les points d’amplitude de crête dans ces fréquences.

  20 meilleures applications Android et conseils de 2016

Dans un document de recherche pour Université Columbia, Wang a déclaré que la méthode leur permettait de supprimer la plupart des parties inutiles d’un clip audio comme le bruit de fond et d’éliminer la distorsion. Cela rend également la taille des impressions suffisamment petite pour qu’il ne faille que quelques millisecondes pour identifier une chanson parmi leur vaste base de données.

L’impact de Shazam

En plus d’être utiles pour les auditeurs moyens qui entendent une chanson qu’ils aiment, les applications d’identification musicale aident également à façonner le monde de la musique.

Les stations de radio et les services de streaming utilisent souvent les données sur ce que les gens sont le plus Shazam-ing pour déterminer quelles pistes sont écoutées par le public. Ceci est utile car cela indique le caractère accrocheur et la popularité potentielle d’une chanson, quel que soit l’artiste. Lorsque vous identifiez une chanson avec l’application, vous voyez immédiatement combien de personnes ont également essayé de l’identifier.

Identification de la musique Soundhound

Depuis la montée en puissance de Shazam, une poignée de concurrents sont également apparus. Soundhound prétend être capable d’identifier une chanson simplement en la chantant ou en la fredonnant, avec des résultats mitigés. Il existe également un identifiant de chanson intégré aux applications vocales telles que Google Assistant qui fonctionnent de manière très similaire au système de Shazam.