Jusqu’à maintenant, Midjourney était souvent considéré comme le summum des générateurs d’images par intelligence artificielle, et à juste titre. Cependant, un nouveau venu, le modèle open-source Flux. 1, développé par Black Forest Labs, a rapidement gravi les échelons, suscitant un vif intérêt grâce à sa capacité à produire des images d’un réalisme saisissant. Cet article met en parallèle Flux et Midjourney, afin de déterminer lequel excelle dans la création d’images, en particulier celles représentant des sujets humains, et d’évaluer leur capacité à flirter avec le surréalisme. La qualité photoréaliste des images générées par ces outils est tout simplement bluffante.
Qu’est-ce que le générateur d’images IA Flux ?
Flux. 1 est un modèle d’intelligence artificielle en open-source, dédié à la création d’images, fruit du travail d’anciens ingénieurs et chercheurs de Stable Diffusion. La startup IA, Black Forest Labs, a lancé trois déclinaisons de ce modèle. La version Flux. 1 [pro], la plus avancée, est destinée à un usage commercial.
Les images produites par l’IA les plus réalistes qu’il m’ait été donné de voir à ce jour.
On approche les 99,7% de perfection, où il devient quasi impossible de distinguer une image générée par IA de la réalité.
(Quelques imperfections subsistent, visibles surtout en zoomant).
Voici le résultat obtenu avec FLUX. Effet de vallée dérangeante. pic.twitter.com/5BIRmZey8B — Roberto Nickson (@rpnickson) 8 août 2024
Les modèles Flux. 1 [dev] et Flux. 1 [schnell], disponibles en open-source, ont déjà bénéficié d’améliorations apportées par la communauté IA, permettant de générer des visuels d’une grande fidélité à la réalité. L’utilisation d’un adaptateur Realism LoRA permet au modèle Flux. 1 [dev] de produire des images d’un réalisme saisissant, y compris dans le rendu des mains, sans distorsion ni artefacts.
Pour éprouver le modèle IA Flux. 1, nous l’avons comparé à Midjourney v6.1. Nous avons utilisé le modèle Realism LoRA de FLUX sur fal.ai (consulter) pour les représentations humaines et FLUX.1 [pro] (consulter) pour les paysages. Voici notre analyse comparative en utilisant les mêmes requêtes pour les deux outils.
Flux vs Midjourney : Comparaison des générations d’images
1. Une femme en déplacement au lever du soleil
Dans cette première série d’images, on constate que celle générée par Flux est plus réaliste. Malgré l’utilisation du paramètre « –style raw » dans Midjourney, l’image produite a un rendu qui évoque le dessin animé.
Flux
Midjourney
2. Un couple de personnes âgées dans un parc
Là encore, le rendu de Flux est plus réaliste et convaincant que celui de Midjourney. L’image de Midjourney a un aspect pictural, tandis que Flux produit une représentation pleine de vie.
Flux
Midjourney
3. L’image d’un chef cuisinier
Dans ce test, ni l’une ni l’autre des images générées par Flux et Midjourney ne réussit à totalement convaincre en termes de réalisme. Bien que les deux images semblent artificielles, le rendu de Midjourney présente une meilleure gestion des reflets et de la lumière.
Midjourney
4. Un château de conte de fées
Ici, je donnerais l’avantage à Flux, qui produit une image digne d’un conte de fées. L’image de Midjourney est également très détaillée.
Midjourney
5. Une ville futuriste la nuit
Pour cette image, on pourrait parler d’égalité, mais celle de Flux présente un rendu plus épuré, tandis que Midjourney a généré une image visuellement plus complexe.
Midjourney
6. Un journal avec des caractères lisibles
Enfin, concernant le rendu de texte, Flux et Midjourney ont tous deux produit un résultat excellent. C’est un domaine où les modèles de synthèse d’images rencontrent souvent des difficultés, mais c’est un signe encourageant de voir un modèle open-source rivaliser avec un modèle fermé comme Midjourney.
Midjourney
Vainqueur : Flux
Flux vs Midjourney : Tarifs
En matière de coûts, Flux est un outil gratuit et open-source, mais pour faire fonctionner le modèle localement, il faut un ordinateur performant avec une carte graphique dédiée. Le modèle comprend pas moins de 12 milliards de paramètres. La meilleure façon de faire fonctionner Flux sur un ordinateur personnel est via Pinokio (site web). Il suffit de télécharger l’application et de commencer à utiliser Flux.
Il existe également de nombreux fournisseurs de services qui proposent de générer des images à l’aide du modèle Flux gratuitement. Cependant, ces offres sont souvent assorties de crédits gratuits limités ou d’un temps de génération qui peut être plus long, en fonction de la charge du système.
Vous pouvez utiliser le modèle Flux. 1 [dev] gratuitement sur HuggingFace (site web). De plus, fal.ai (site web) propose des modèles LoRA, mais vous bénéficiez uniquement de crédits gratuits d’une valeur de 1 $ au départ. Au-delà, il faudra acheter des crédits en fonction de votre utilisation.
Quant à Midjourney, c’est un service payant, avec un abonnement mensuel à 10 $, en cas de paiement mensuel. L’avantage est que la génération d’images est rapide et que l’interface utilisateur est fluide.
Vainqueur : Flux
Flux vs Midjourney : Fonctionnalités
Flux étant un modèle récent, il ne propose pas encore beaucoup de fonctions d’édition d’images IA prêtes à l’emploi. Certains services comme BasedLabs (site web) permettent d’agrandir des images et de définir le rapport d’aspect. Il est également possible de choisir le nombre d’images à générer simultanément. Les utilisateurs avertis peuvent modifier la valeur de départ, le nombre d’étapes et les paramètres de réduction du bruit.
Midjourney, en revanche, est plus riche en fonctionnalités et offre de nombreuses options. Il est possible de définir le rapport d’aspect, de choisir un style et une esthétique. On peut même utiliser d’anciens modèles de Midjourney et créer des images avec un aspect naturel grâce à l’option « Raw ».
De plus, après la création d’une image, on peut l’agrandir, faire un zoom arrière, ajouter des détails, effectuer de l’inpainting avec l’outil lasso, la recadrer, et bien plus. L’image peut être modifiée à l’aide de nouvelles requêtes. En ce qui concerne l’inpainting et l’outpainting, Midjourney propose davantage d’outils et de contrôle que Flux, pour le moment.
Vainqueur : Midjourney
Flux vs Midjourney : Crédits de contenu
Pour les artistes, il est important que le service prenne en charge la norme des Crédits de Contenu. Cela permet de connaître l’origine d’une image et de vérifier si elle a été modifiée. Malheureusement, ni Midjourney ni Flux ne prennent en charge cette norme. Ils n’intègrent aucun type de métadonnées vérifiables dans leurs images IA.
Vainqueur : Aucun
Pour résumer cette comparaison entre Flux et Midjourney, je suis très impressionné par les capacités du modèle Flux. Il représente une alternative gratuite et performante à Midjourney. La communauté open-source peut s’en saisir pour développer de nouvelles fonctionnalités, comme l’inpainting et l’outpainting. Cela conclut notre analyse comparative. Si vous avez des questions, n’hésitez pas à nous les poser dans les commentaires ci-dessous.