Stable Audio Open : un nouveau générateur de sons par IA

Stable Audio Open, le dernier modèle IA de Stability AI, génère des sons à partir de textes. Quels usages pour les musiciens et concepteurs sonores ?

par Fanny Gastaldi

10 juin 2024 0

Stability AI, connu pour son générateur d’art AI Stable Diffusion, vient de lancer un nouveau modèle IA ouvert pour la génération de sons et de musiques. Que permet de faire ce nouvel outil ? Quelles sont ses fonctionnalités et ses limites ?

Qu’est-ce que Stable Audio Open ?

Stable Audio Open est un générateur de sons capable de créer des enregistrements audio de haute qualité à partir d’un texte.

Par exemple, si vous écrivez “Rock beat played in a treated studio, session drumming on an acoustic kit” peut générer un enregistrement sonore de 47 secondes correspondant à cette description.

Interface Stable Audio Open — Aperçu de l’Interface

Fonctionnalités principales

Stable Audio Open est conçu pour créer une variété de sons comme par exemple :

des rythmes de batterie : parfait pour les producteurs à la recherche de nouveaux beats ;
des riffs d’instruments (phrase musicale très mélodique et répétitive) : idéal pour ajouter des éléments musicaux à une composition ;
des sons d’ambiance : pour enrichir l’atmosphère d’un film ou d’un jeu vidéo.

Le modèle a été formé sur environ 486 000 échantillons provenant de bibliothèques de musique libre de droits, telles que FreeSound et le Free Music Archive. Cela permet de créer des contenus respectant les droits des créateurs.

Comment fonctionne cet outil ?

Une des grandes forces de Stable Audio Open est sa capacité à être ajusté et amélioré par la communauté d’utilisateurs.

Par exemple, un batteur peut utiliser des enregistrements de ses propres performances pour entraîner le modèle et générer de nouveaux rythmes personnalisés.

Cette personnalisation offre un potentiel énorme pour les musiciens et les concepteurs sonores qui cherchent à créer des sons uniques.

Comparaison avec Stable Audio

Contrairement à Stable Audio Open, Stable Audio propose des pistes complètes et structurées pouvant durer jusqu’à trois minutes. Il est également capable de générer des compositions musicales et de transformer des morceaux.

En revanche, Stable Audio Open se concentre sur des extraits plus courts.

Quelles sont les limites ?

Malgré ses nombreuses fonctionnalités, Stable Audio Open présente certaines limites :

Durée limitée : le modèle ne peut générer que des extraits de 47 secondes maximum ;
Incapacité à produire des mélodies ou des voix de qualité : le modèle n’est pas optimisé pour ces tâches, et les résultats peuvent ne pas être à la hauteur des attentes ;
Usage commercial interdit.

Stability AI reconnaît également que le modèle peut être restreint car il ne couvre pas tous les styles musicaux.

Stable Audio Open est-il accessible en France ?

Stable Audio Open est disponible en open source, et peut être téléchargé sur la plateforme Hugging Face.

Vous pouvez retrouver directement ici l’article officiel de Stability AI

Ps : si vous recherchez une solution gratuite pour séparer la voix d’une musique, n’hésitez pas à consulter notre article dédié.

Avant de se quitter…

Si cet article sur Stability AI et son modèle Stable Audio Open vous a plu, n’hésitez pas à le partager sur les réseaux sociaux, à vous abonner à notre newsletter digitale et/ou à nous suivre sur Google Actualités pour recevoir nos prochains articles.

Vous pouvez également suivre nos meilleurs articles via notre flux RSS : https://www.leptidigital.fr/tag/newsletter-digitale/feed/ (il vous suffit de l’insérer dans votre lecteur de flux RSS préféré (ex : Feedly)).

Nous sommes aussi actifs sur LinkedIn, X, Facebook, Threads et YouTube. On s’y retrouve ?

Un avis ? post

Fanny Gastaldi

À l’heure actuelle, je me consacre au journalisme avec une spécialisation en cybersécurité, intelligence artificielle et culture internet, tout en nourrissant un vif intérêt pour les domaines relatifs aux sciences humaines. Mon objectif principal est d’éclaircir et rendre accessible des sujets fréquemment perçus comme obscures ou complexes. Pour me contacter : [email protected]

Newsletter Veille Digitale