La mise à jour surmonte un obstacle majeur à la génération d’images IA, mais peut toujours produire des erreurs logiques.
Dans le contexte: Midjourney v6 est arrivé comme cadeau de Noël pour les passionnés d’IA. Cette dernière version du générateur d’images promet des images plus réalistes, des fonctionnalités supplémentaires et corrige certaines lacunes importantes de l’outil. Cependant, les utilisateurs expérimentés devront peut-être réapprendre certaines choses.
La sixième itération de Midjourney est désormais disponible pour tous les utilisateurs. Il n’a fallu que quelques heures après le lancement pour que les réseaux sociaux soient inondés d’images présentant ses améliorations.
Pour utiliser Midjourney v6, tapez simplement « -v 6 » après n’importe quelle invite (rappelez-vous que Midjourney fonctionne via Discord). Les utilisateurs peuvent également activer la mise à jour en entrant «/settings» sur le serveur Midjourney Discord ou en envoyant un message direct au bot Midjourney du serveur et en sélectionnant V6 dans le menu déroulant.
MidJourney v6 est bien meilleur pour inclure des mots dans les images � »ï¿½
Voici quelques exemples.
Invites dans l’ALT ! pic.twitter.com/EAGdq65hEZ
– Ammaar Reshi (@ammaar) 21 décembre 2023
La graphiste Julie Wieland a comparé Midjourney v6 à un projet indépendant évoluant vers une production hollywoodienne, louant les effets d’éclairage améliorés. D’autres utilisateurs ont publié de nombreuses images réalistes, certaines impossibles à distinguer d’un travail édité à la main. Même si des erreurs surviennent encore, leur recherche semble prendre plus de temps à chaque nouvelle version, ce qui est à la fois fascinant et inquiétant.
Développement de Midjourney tout au long d’une période d’environ 1,5 ans pic.twitter.com/slfnIbDpXW
– Vensy (@vensykrishna) 21 décembre 2023
Wieland a également noté que le système d’invite mis à jour l’obligeait à réévaluer son approche de l’utilisation de Midjourney. Les développeurs affirment que la compréhension du langage naturel de l’outil s’est améliorée. L’utilisatrice Tatiana Tsiguleva a noté que les invites nécessitent désormais des indications claires sur le style, le sujet, le décor, la composition et d’autres éléments.
Midjourney v6 donne vraiment l’impression que la production indépendante a évolué vers une production hollywoodienne…
Midjourney v6 + magnific + lightroom pic.twitter.com/Akq86PpxuS
– Julie W. Design (@juliewdesign_) 21 décembre 2023
Une nouvelle fonctionnalité notable de Midjourney v6 est sa capacité à restituer un texte lisible. Auparavant, les mots tronqués étaient un signe courant des images générées par l’IA. Désormais, les utilisateurs partagent des images avec du texte dans différents styles, tels que des enseignes au néon ou à la craie, démontrant la maîtrise de l’outil dans ce domaine. Cette amélioration permet également à Midjourney de recréer avec précision les logos de marques connues comme McDonald’s ou Coca-Cola.

L’image ci-dessous est un assez bon exemple du chemin parcouru par Midjourney et des lacunes restantes de la génération d’images IA. Il représente de manière convaincante une affiche fictive de la série Netflix mettant en vedette Leonardo DiCaprio dans le rôle de Vladimir Lénine, rendant même avec précision le titre et le logo Netflix, ce que les versions précédentes ne pouvaient pas faire.

Cependant, une affiche Netflix authentique n’utiliserait probablement pas la même police pour le mot « Netflix » sous le titre. De plus, le deuxième plan, en fonction des décisions créatives, pourrait ne pas comporter le nom de l’homme politique russe dans l’alphabet latin. Il n’est pas certain que Midjourney v6 puisse gérer du texte non latin.
Film 35 mm d’un ancien marché romain pendant la journée. Des gens en tenue romaine traditionnelle font du troc, il y a des étals de fruits, de légumes et de poteries et, à l’arrière-plan, le Colisée est visible.
–v 6 (en haut)
–v 5.2 (en bas) pic.twitter.com/ZHZyRs8MAz– Nick St.Pierre (@nickfloats) 21 décembre 2023
Une comparaison de Midjourney v5.2 et v6 en décrivant un ancien marché romain illustre un autre point. L’image v6 semble plus authentique que la version de son prédécesseur. Cependant, les deux montrent de manière inexacte le Colisée en ruines à l’époque romaine antique. Cela met en évidence la lutte continue de l’IA générative avec le contexte et suggère qu’une incitation prudente pourrait atténuer ces erreurs logiques.
1. Invite : un homme debout seul dans une zone sombre et vide, regardant une enseigne au néon indiquant « VIDE » pic.twitter.com/LTcDE9T5eB
– Chase Lean (@chaseleantj) 21 décembre 2023
Un autre développement intéressant concerne les images multi-panneaux. Bien que les générateurs d’images IA soient encore confrontés à des défis pour maintenir la continuité visuelle dans les séquences d’événements, Midjourney v6 peut créer une image avec plusieurs panneaux, chacun présentant un sujet ou un angle différent.



