Plus besoin d’apprendre l’ingénierie avancée des invites
La grande image: DALL-E est l’un des principaux services d’IA conçu pour générer des images à partir d’invites textuelles. Développé par OpenAI, ce modèle d’apprentissage automatique évolue continuellement pour offrir aux utilisateurs des outils plus avancés et plus conviviaux pour transformer leurs idées en contenu visuel étrange.
OpenAI a annoncé DALL-E 3, la nouvelle génération de son célèbre algorithme de génération de texte en image. DALL-E 3 peut répondre à des demandes nuancées et générer « des images extrêmement détaillées et précises », selon la société basée à San Francisco. Il a été construit nativement sur le modèle de chatbot ML de ChatGPT.
DALL-E 3 permet aux utilisateurs d’utiliser ChatGPT comme une sorte de « partenaire de brainstorming » et d’affinement de leurs invites textuelles, comme l’explique OpenAI. Les utilisateurs peuvent demander au chatbot de créer des images à partir d’une idée simple d’une phrase ou d’un paragraphe complexe et détaillé. Lorsqu’on lui donne une idée, ChatGPT générera automatiquement l’invite la plus appropriée et la plus « sur mesure » pour alimenter le modèle d’IA texte-image de DALL-E.
Si l’image résultante n’est pas tout à fait correcte, OpenAI indique que les utilisateurs peuvent demander à ChatGPT de modifier l’invite existante avec seulement quelques mots. Comme les versions précédentes, DALL-E 3 limite la capacité du modèle ML à générer du contenu « violent, adulte ou haineux », bien que certains utilisateurs ingénieux aient trouvé des moyens de contourner ces prétendues limites dans le passé.
RIP à mi-parcours pic.twitter.com/gaRlA60ORA
– Gaut (@0xgaut) 20 septembre 2023
Comme mesure supplémentaire pour prévenir les « générations nuisibles », DALL-E 3 a mis en place des mesures d’atténuation pour refuser les demandes demandant des images de personnalités publiques connues. Les performances en matière de sécurité ont été « améliorées » grâce à des séances de tests de résistance menées par des experts, selon OpenAI. En outre, l’entreprise recherche le meilleur moyen d’aider les gens à identifier le moment où une image a été créée avec l’IA.
OpenAI expérimente un « classificateur de provenance », qui est un nouvel outil interne pour l’identification d’images par l’IA. Cependant, OpenAI n’a pas encore partagé cet outil avec ses utilisateurs. DALL-E 3 est également conçu pour refuser les demandes demandant une image imitant le style d’un « artiste vivant », explique OpenAI. Les créateurs peuvent désormais également retirer leurs images des futures sessions de formation aux algorithmes.
OpenAI affirme que DALL-E 3 constitue une amélioration significative par rapport à DALL-E 2. Même lorsqu’elles sont chargées de la même invite textuelle, les images générées par l’algorithme nouvellement formé sont beaucoup plus fidèles à la demande de l’utilisateur.
DALL-E 3 sera disponible pour les clients ChatGPT Plus et Enterprise en octobre, et il est prévu de le déployer sur l’API et dans les laboratoires plus tard cet automne. Microsoft, Shutterstock et d’autres partenaires OpenAI seront probablement parmi les premiers à bénéficier de cette technologie améliorée de génération d’images.