Comment faire de la musique AI avec MusicGen de Meta

Photo of author

By pierre



Meta a dévoilé MusicGen, un nouveau générateur musical basé sur l’intelligence artificielle, capable de transformer des descriptions textuelles en mélodies. Une démonstration est accessible en ligne, nécessitant uniquement un navigateur web. Les résultats obtenus sont plutôt satisfaisants et témoignent des progrès considérables réalisés par les modèles d’IA dédiés à la musique.

Voici un aperçu de ce qu’il faut savoir sur MusicGen et comment créer de la musique avec cet outil.

Qu’est-ce que MusicGen ?

En juin 2023, Meta a lancé MusicGen, son modèle d’IA pour la génération musicale. Il n’est pas le premier à s’attaquer au défi complexe de la synthèse musicale à partir de simples instructions textuelles. Des outils tels que Jukebox d’OpenAI ou MusicLM permettent déjà de créer des morceaux de musique.

Cependant, Meta est la première entreprise à rendre son code open-source. Cela permet aux utilisateurs d’exécuter le logiciel localement sur leur ordinateur, à condition de disposer d’une carte graphique avec au moins 16 Go de mémoire. Il a même été possible de le faire fonctionner avec 11 Go.

Pour ceux qui ne possèdent pas le matériel requis, l’application web MusicGen est accessible gratuitement via un navigateur. Sur la démo en ligne, il faut compter environ une minute pour générer un extrait sonore d’une douzaine de secondes.

Comment la musique générée par MusicGen sonne-t-elle ?

Selon Meta, MusicGen est capable de produire des échantillons musicaux de bonne qualité. Il faut cependant noter que la notion de « haute qualité » est ici définie comme 32 kHz, ce qui se situe entre les standards de la synthèse vocale (16 kHz) et de la musique numérique (44,1 kHz).

En réalité, la qualité sonore n’atteint pas les standards auxquels on est habitué en écoutant la radio ou des plateformes de streaming. Toutefois, compte tenu des autres générateurs musicaux existants et de la technologie actuelle, la qualité audio est globalement bonne, avec un faible niveau de bruit.

Quant à la correspondance entre la musique produite et les instructions fournies, l’écoute des exemples générés permet de se faire une idée précise. Le modèle respecte les genres musicaux populaires et offre une structure musicale plus cohérente que les solutions précédentes.

Comment créer de la musique avec MusicGen ?

L’utilisation de MusicGen est simple et ne nécessite pas d’inscription. L’interface est intuitive, ce qui permet de s’amuser facilement avec cet outil.

Voici comment générer de la musique avec MusicGen :

  • Accédez à l’application web MusicGen.
  • Dans la zone de texte « Décrivez votre musique », entrez votre requête. Vous pouvez saisir une instruction simple comme « mélodie folklorique irlandaise », ou la rendre plus précise en indiquant l’instrument, le tempo, le genre ou l’émotion.
  • Cliquez sur le bouton « Générer » pour lancer le processus. Après environ une à deux minutes, un lecteur audio apparaît dans la section « Generated Music » à droite.
  • Passez votre souris sur le module pour afficher les commandes du lecteur et écouter le fichier. Vous pouvez aussi télécharger le fichier sur votre ordinateur en cliquant sur l’icône de téléchargement en haut à droite. Notez que le fichier est uniquement disponible au format .mp4.
  • Si vous souhaitez conditionner les résultats à l’aide d’une mélodie existante, vous pouvez télécharger un enregistrement dans le module situé à côté de la zone de texte. Il est également possible d’enregistrer une mélodie avec votre microphone en sélectionnant « Mic ».
  • Le conditionnement via une mélodie utilise à la fois la description textuelle et la mélodie fournie comme référence, ce qui permet d’influencer le résultat généré par MusicGen.

    Quelles sont les restrictions d’utilisation de MusicGen ?

    Le code de MusicGen est distribué librement sous licence MIT avec certaines restrictions. En ce qui concerne l’audio généré avec ce modèle, il n’existe pas de directives légales clairement établies. Il est toutefois conseillé de tenir compte de l’avertissement de Meta concernant l’utilisation de MusicGen:

    « Le modèle ne doit pas être utilisé pour créer ou diffuser intentionnellement des morceaux de musique qui génèrent des environnements hostiles ou aliénants. Ceci inclut la génération de musique susceptible d’être perçue comme dérangeante, pénible ou offensante, ainsi que tout contenu propageant des stéréotypes historiques ou actuels. »

    Meta précise que MusicGen est destiné aux chercheurs souhaitant explorer la génération de musique par IA et non à des « usages en aval », sous-entendant des activités comme le téléchargement et la distribution de musique générée par IA sur les plateformes de streaming.

    Les aspects éthiques soulevés sont comparables à ceux de la création artistique par IA. La question du consentement à l’utilisation des données pour entraîner les modèles, ainsi que la rémunération et la reconnaissance des artistes sont autant de raisons qui poussent Meta à la prudence.

    En résumé, explorer le modèle pour le simple plaisir ne devrait pas poser de problème, mais l’utilisation de l’audio pour la musique commerciale pourrait s’avérer plus délicate. L’avenir de la musique pop et l’influence de l’IA sont des sujets qui suscitent beaucoup d’interrogations.

    Meta a enrichi l’offre de modèles de génération musicale avec MusicGen, un modèle d’IA open-source capable de créer de la musique à partir de simples instructions textuelles. Si vous souhaitez tester cette technologie, une démo est disponible en ligne, accessible depuis n’importe quel navigateur.