Alternatives à Sora d’OpenAI pour la génération vidéo IA
L’outil de conversion texte-vidéo Sora, développé par OpenAI, suscite un engouement comparable à celui de ChatGPT lors de son lancement. Sora impressionne par sa capacité à produire des vidéos de haute qualité à partir de simples descriptions textuelles. Toutefois, cette technologie n’est pas totalement inédite et n’est pas encore largement disponible. Ainsi, si vous recherchez une solution alternative à Sora, plusieurs options s’offrent à vous.
MAKEUSEOF VIDÉO DU JOUR
-
Version gratuite:
125 crédits -
Version standard:
15 $/mois (12 $ avec facturation annuelle) pour 625 crédits mensuels
Runway Gen-2 est probablement l’outil le plus comparable à Sora d’OpenAI. Il utilise un système d’intelligence artificielle multimodal pour créer des séquences vidéo à partir d’instructions textuelles.
Gen-2 offre la possibilité d’utiliser des images ou des vidéos comme référence pour la génération de nouvelles séquences. Il reste à voir si Sora d’OpenAI intégrera également cette fonctionnalité.
En se basant sur les exemples de vidéos partagées par OpenAI, Sora semble surpasser Runway Gen-2 en termes de qualité. Cependant, compte tenu de la rapidité du développement dans le domaine de l’IA (et du fait que Runway a lancé Gen-2 environ un an avant l’annonce de Sora), une lutte acharnée est à prévoir entre Sora et Runway Gen-2 (ainsi que ses futures versions) pour le titre de meilleur générateur vidéo par IA.
-
Version gratuite:
250 crédits de départ (puis 30 crédits gratuits par jour après épuisement des crédits initiaux) -
Version standard:
10 $/mois (8 $ avec facturation annuelle) pour 700 crédits mensuels
Pika est une autre option pour créer des vidéos et des animations 3D à partir de texte et d’images. L’outil est disponible via une application web et sur Discord, mais la qualité de sortie et les fonctionnalités varient selon la plateforme utilisée.
L’application web offre la possibilité de modifier des sections précises des clips générés, d’agrandir le canevas vidéo et d’ajouter une synchronisation labiale. Ces fonctionnalités ne sont pas disponibles sur Discord.
Il est donc recommandé de tester les deux plateformes pour déterminer celle qui offre les meilleurs résultats. L’exemple ci-dessous a été généré via la version web de Pika, en utilisant la même instruction que la vidéo virale « Lady Walking in Tokyo » de Sora d’OpenAI.
Une femme élégante marche dans une rue de Tokyo, baignée de la lumière chaude des néons et des enseignes animées de la ville. Elle porte une veste en cuir noire, une longue robe rouge, des bottes noires et un sac à main noir. Elle a des lunettes de soleil et du rouge à lèvres rouge. Elle marche avec assurance et décontraction. Le sol de la rue est mouillé et reflète les lumières colorées, créant un effet de miroir. De nombreux piétons se promènent alentour.
En utilisant la même instruction (/create + prompt) sur le serveur Discord de Pika, on obtient le résultat ci-dessous :
Nous vous laissons juger quelle version est la meilleure, mais il est clair que Pika doit encore rattraper son retard en termes de qualité par rapport aux vidéos générées par Sora. Cependant, ses fonctionnalités comme la synchronisation labiale et l’animation d’images lui donnent un avantage, du moins pour l’instant.
Pixverse est une autre alternative à Sora d’OpenAI pour créer des vidéos réalistes à partir de texte. Pixverse propose également une version web et un serveur Discord pour la création vidéo.
La plateforme web offre une expérience plus complète, permettant de visualiser, filtrer et modifier les vidéos générées.
L’exemple ci-dessus a été créé avec la version web de Pixverse. Bien qu’il soit possible de régénérer pour améliorer le résultat (gratuitement), le serveur Discord a l’avantage de générer quatre clips simultanément, vous offrant ainsi un plus grand choix sans nécessiter de multiples tentatives. Voici un exemple généré via le serveur Discord :
Vous pouvez rejoindre le serveur Discord de Pixverse et créer vos clips à l’aide de la commande /create. Vous pouvez également sélectionner le format d’image et ajouter une invite négative si nécessaire.
En termes de qualité, Pixverse se situe dans la même catégorie que Pika, légèrement en dessous de Sora.
-
Version gratuite:
100 crédits initiaux -
Version « Explorateur »:
5 $/mois pour 300 crédits
Kaiber est un outil de génération vidéo IA axé sur les artistes. Il permet de créer des vidéos à partir d’images ou de descriptions textuelles.
Kaiber gère également la réactivité audio : vous pouvez télécharger une chanson, et l’IA génèrera une vidéo en accord avec le rythme et l’ambiance de la musique. Vous pouvez aussi personnaliser la durée, les dimensions, les mouvements de caméra et l’image de départ. Kaiber est accessible via le web et ses applications mobiles.
Le point fort de Kaiber réside dans sa capacité à créer des clips synchronisés avec le rythme des sons importés. Ses fonctionnalités axées sur les artistes constituent également un atout face à Sora. Néanmoins, concernant le réalisme des vidéos générées, Sora demeure en tête.
-
Version gratuite:
Essai vidéo -
Version « Entrée »:
29 $/mois (22 $ avec facturation annuelle) pour 10 minutes de vidéo
Synthesia est un générateur de texte en vidéo IA permettant de créer des vidéos parlantes réalistes à partir de scripts textuels. Vous pouvez personnaliser votre vidéo en choisissant parmi différents avatars, arrière-plans et langues.
Synthesia se distingue de Sora en ce sens qu’elle n’engendre pas de visuels à partir de rien, mais utilise des images existantes et les adapte au texte. Synthesia est également limitée aux vidéos parlantes, tandis que Sora peut générer tout type de vidéo à partir de texte.
Synthesia est une bonne alternative à Sora pour créer des vidéos attrayantes et personnalisées, à des fins éducatives, marketing ou de divertissement.
-
Version gratuite:
1 minute/jour -
Version « Entrée »:
19,99 $ (14,99 $ avec facturation annuelle) pour 10 minutes de vidéo sans filigrane
Vidnoz est un autre générateur vidéo IA qui crée des vidéos parlantes à partir de scripts texte. Vidnoz AI utilise le traitement du langage naturel (NLP) et la vision par ordinateur pour générer une synchronisation labiale et des expressions faciales réalistes pour les avatars. Vous pouvez également personnaliser l’apparence, les vêtements et les accessoires des avatars.
Vidnoz AI est comparable à Synthesia en termes de fonctionnalités, mais offre plus de possibilités de personnalisation lors de la création de votre vidéo d’essai gratuite. Vous avez le choix entre différents avatars et voix, ce que Synthesia ne propose pas.
Si l’on se fie aux évènements qui ont suivi le lancement de ChatGPT par OpenAI, on peut s’attendre à l’arrivée de nombreuses autres plateformes de génération vidéo par IA. On peut également prévoir que Lumiere de Google et Make-A-Video de Meta deviendront accessibles au grand public dans un avenir proche.