Créer des images avec AI

Générer des images et des graphiques avec des outils d'IA

Lorsqu'il s'agit de l'IA générative, c'est souvent le sujet des textes qui reçoit le plus d'attention. Voir mon guide sur la création de textes avec l'IA. Mais les progrès dans le domaine des images et des graphiques sont tout aussi passionnants. Et pour les vidéos, tu as aujourd'hui un aperçu de ce qui sera possible dans un avenir peut-être pas si lointain. Dans cet article, je te donne un aperçu des possibilités et des limites des offres visuelles de l'IA.

Les images, les graphiques et les vidéos valorisent énormément les contenus sur le web. Ils attirent davantage l'attention et peuvent non seulement expliquer un sujet, mais aussi le rendre émotionnel. Tu as donc la possibilité de montrer ta marque et ton identité d'entreprise et de te démarquer des autres.

Jusqu'à présent, les personnes ayant besoin de contenus visuels avaient principalement les possibilités suivantes :

1. créer toi-même. Pour cela, il te faut, en plus du talent et des connaissances, les outils adéquats ainsi que du temps pour la réalisation. Dans de nombreux cas, ce n'est pas réaliste.

2. engager quelqu'un . C'est certainement l'option la plus qualitative : tu trouves un professionnel adapté. Les résultats sont généralement les meilleurs, car tu fais créer des visuels adaptés à tes besoins. Mais sans surprise, c'est aussi là que les coûts sont les plus élevés.

3. des photos de stock. Tu peux utiliser des plateformes comme Shutterstock, Adobe Stock ou Depositphotos. Elles offrent un grand choix, sont de bonne qualité et abordables. Il existe même des offres gratuites comme Pexels ou Pixelio. Inconvénient : tu obtiens des photos et des graphiques prêts à l'emploi, que d'autres utilisent également. Les adaptations individuelles ne sont généralement pas possibles. Tu dois les faire toi-même ou les commander.

Échantillon d'images AI
Premier essai : une image de contribution de Dall-E pour ce post

Les générateurs d'images d'IA semblent à première vue être une nouvelle alternative intéressante. Après tout, ils fournissent un contenu visuel rapidement et facilement par commande de texte. Tu peux donc théoriquement générer ici une visualisation exactement adaptée et ce, à peu de frais ou même gratuitement.

Les générateurs d'images d'IA les plus connus sont Dall-E de OpenAI, qui est aussi derrière ChatGPT, MidJourney et Stable Diffusion. Ils ont tous des offres gratuites et payantes. Stable Diffusion est open source, c'est pourquoi une communauté active s'est déjà développée autour de cet outil. Tu peux donc utiliser Stable Diffusion directement sur ton propre ordinateur - ou même sur un smartphone ou une tablette.

A quoi servent les offres d'IA pour les images ?

Ces générateurs d'images créent des œuvres dans tous les styles : illustrations, dessins, photos, infographies ou même le look d'une peinture à l'huile. Les limites sont ici fixées par le matériel d'entraînement, ton imagination ainsi que ton habileté et ta persévérance dans la recherche du résultat parfait.

Et cela nous amène à un point faible de ces offres, une fois que tu les as essayées toi-même : il n'est pas toujours aussi facile qu'on l'espère d'obtenir le résultat souhaité. Du moins, il ne suffit pas d'appuyer sur un bouton, comme on le décrit et le promet. Parfois, tu as de la chance et tu obtiens rapidement un résultat. Parfois, tu t'arraches les cheveux parce que ça ne marche pas.

Avec le temps, tu apprendras comment obtenir les meilleurs résultats. L'élément central est ici le prompt, c'est-à-dire l'instruction écrite à l'outil d'IA. Ce qui y fonctionne bien dépend toutefois fortement de l'outil.

Dall-E 3, par exemple, est très puissant, mais ChatGPT se trouve entre toi et l'application. Comme pour le texte, tu expliques donc en langage naturel ce que tu as en tête. ChatGPT le prend en compte et le traduit en instructions pour Dall-E. Si le résultat ne te plaît pas, tu expliques ce qui doit être changé. Et ainsi de suite.

A l'autre bout du spectre, il y a Stable Diffusion. Même si tu l'utilises via l'application commerciale DreamStudio, tu as plusieurs options manuelles. Tu auras encore plus de liberté si tu utilises Stable Diffusion via une interface sur ton propre ordinateur, comme Automatic1111 ou Draw Things

Pour expliquer les choses de cette manière : Dall-E est macOS, Stable Diffusion est Linux. Car Dall-E produit de bons résultats assez rapidement. Mais en contrepartie, tu dois accepter que le système limite ce que tu peux faire et comment. Stable Diffusion, quant à lui, est déroutant et complexe au début. Mais en contrepartie, il est possible de faire énormément de choses et tu peux utiliser de nombreux leviers.

AI Images Échantillon noir & blanc
La deuxième tentative avec l'invite : "Moins de couleurs, s'il te plaît".

Peut-être que MidJourney pourrait être le troisième de la liste pour Windows. Je dois cependant avouer que je n'aime pas du tout l'interface de MidJourney au sein de l'offre de chat Discourse. Je n'ai donc que très peu d'expérience. MidJourney est en même temps très populaire, car tu peux obtenir de bons résultats avec peu d'efforts. Mais en ce moment, je préfère utiliser Dall-E 3 via ChatGPT.

Défis et erreurs typiques

Une erreur que je vois régulièrement : on essaie trop souvent de créer des images photoréalistes. De mon point de vue, ce n'est pas idéal pour deux raisons :

  1. Les résultats ont souvent l'air encore plus artificiels que les photos de stock sur lesquelles ils sont basés. A cela s'ajoute souvent un manque de finition pour le look des images. En effet, les photos de stock sont généralement conçues de la manière la plus neutre possible, ce qui les rend à la fois flexibles et ennuyeuses. Ce qui rend les photos intéressantes, c'est la composition de l'image, l'éclairage, le jeu avec la netteté et le flou. Si tu ne donnes pas de directives à ce sujet, les outils d'IA auront tendance à produire quelque chose de médiocre.
  2. Les problèmes et les erreurs dans l'image sont plus visibles, alors que dans d'autres styles, ils passent pour l'expression de la "liberté créative". Un terme technique est ici "uncanny valley" : le point où un visage humain presque correct devient dérangeant à cause d'une petite erreur.

C'est pourquoi je me tourne souvent vers les illustrations et les graphiques. Cela ne signifie pas pour autant que les images photoréalistes ne sont pas utiles du tout. Mais il est bon d'avoir d'autres possibilités à l'esprit.

Quel que soit le style, il est important de comprendre les limites des outils. Elles peuvent parfois être surprenantes. Pour un motif, cela fonctionne du premier coup, alors qu'une autre idée ne fonctionne pas, même après des dizaines d'essais. Cela est souvent lié à ce que l'IA connaît de son matériel d'entraînement. Elle peut certes créer des images qui n'existent pas encore ailleurs.

Mais tu dois en même temps être conscient que ces outils ne comprennent pas le moins du monde ce qu'ils représentent dans l'image. Ils n'ont aucune idée du monde en général ou, par exemple, de l'anatomie humaine en particulier.

Images AI Échantillon photoréaliste
Le photoréalisme ne fonctionne pas encore vraiment.

Les mains sont un exemple bien connu de ce problème. Dall-E ou Stable Diffusion ne savent pas à quoi ressemble ou fonctionne une main humaine. Ils ont certes vu des mains pendant l'entraînement. Mais elles ne sont parfois visibles que de côté, partiellement cachées ou deux mains sont superposées. L'IA ne comprend pas qu'une main humaine moyenne a cinq doigts et que parfois, à cause de la perspective ou d'autres circonstances, on ne les voit pas tous.

Les scènes complexes sont également difficiles. Exemple : tu veux une image montrant une équipe de cinq personnes et tu as une idée concrète de ce à quoi chaque personne doit ressembler. Bonne chance avec ça ! J'espère que tu as apporté du temps et de la patience ...

Il en va de même lorsqu'une personne doit prendre une pose clairement définie ou que tu as une composition d'image précise en tête. Dans ce cas, il est utile de créer une image non seulement à partir d'un prompt, mais aussi à partir d'un modèle (connu sous le nom de "Image to Image" par opposition à "Text to Image"). Stable Diffusion propose également l'outil ControlNet, qui te permet de définir les éléments spécifiques d'un modèle qui apparaîtront dans la nouvelle image.

Tu le sais bien : plus tes exigences sont élevées et plus ton idée est détaillée, plus cela devient difficile. Par contre, cela fonctionne bien si tu te laisses inspirer par l'IA : Tu décris par exemple à ChatGPT l'utilisation que tu veux faire de l'image et ce qu'elle doit représenter, puis tu vois dans quelle mesure le résultat te plaît et tu t'en rapproches pas à pas. Avec Stable Diffusion, tu expérimenteras avec l'invite, mais aussi avec de nombreuses autres options et réglages.

Les côtés problématiques des générateurs d'images

Mais ce défi n'est pas le seul. Un autre est : ces IA montrent ce qui se trouve dans le matériel d'entraînement. Et cela inclut les préjugés et les clichés. Cela peut inclure des rôles stéréotypés pour les sexes ou même des visions du monde racistes. En fin de compte, il est de ta responsabilité de reconnaître et d'éliminer ces représentations problématiques. ChatGPT et Dall-E essaient activement d'éviter cela.

Un autre point concerne le "matériel d'entraînement" déjà mentionné à plusieurs reprises. Tout comme les générateurs de texte, ces outils ont appris leurs compétences à partir de modèles humains. Ils ont été nourris d'une énorme quantité de données. La question de savoir si ces photos, graphiques, illustrations, peintures et autres œuvres pouvaient être utilisées à cet effet fait l'objet d'un débat animé.

"*" indique les champs requis

Je souhaite m'abonner à la newsletter pour être informé des nouveaux articles de blog, des ebooks, des fonctionnalités et des nouvelles de WordPress. Je peux retirer mon consentement à tout moment. Merci de prendre connaissance de notre politique de confidentialité.
Ce champ sert à la validation et ne doit pas être modifié.

Certains considèrent cela comme une violation des droits d'auteur. D'autres comparent cela à la manière dont les artistes en chair et en os apprennent des modèles et suivent les tendances. Il serait trop long d'illustrer la discussion ici. Certains fournisseurs, comme Adobe, utilisent pour leur outil l'offre Stockfoto interne et prévoient en même temps une rémunération pour cette utilisation. Cela devrait permettre au secteur commercial et surtout aux entreprises de l'utiliser.

Perspective d'avenir : De l'image à l'image animée

Le prochain domaine passionnant pour les outils d'IA se dessine déjà : la vidéo. Il existe ici une série de nouvelles offres qui utilisent soit une saisie de texte comme point de départ, soit une image.

La qualité des résultats est tout à fait étonnante. Cependant, les clips sont encore très courts. Les artefacts typiques et les particularités des générateurs d'images IA s'y retrouvent également. Pour l'instant, ils semblent mieux fonctionner dans les scènes relativement statiques. Plus les choses deviennent complexes, plus les détails absurdes ont tendance à se glisser.

En même temps, il n'y a pas si longtemps, les générateurs de texte et d'images en étaient au même point. Il y a quelques années, nous étions fascinés par la possibilité de créer n'importe quelle photo de portrait. Aujourd'hui, nous nous plaignons si un détail de notre production photoréaliste ne correspond pas à 100%.

En ce sens, il y a un espoir légitime que ces outils se développent sensiblement dans les mois et années à venir. Voici quelques exemples :

Alors que les générateurs de vidéos sont encore de la musique d'avenir, je trouve que les générateurs d'images sont déjà utiles et judicieux aujourd'hui. Ils ont leurs limites et leurs problèmes. Ils ne remplacent donc pas les photos ou les graphiques créés manuellement. Ils offrent plutôt une option supplémentaire et dans des mains créatives, ils peuvent être un outil utile.

Je les vois ainsi au même niveau que les générateurs de texte actuels : ils soutiennent et parfois donnent des ailes. Ils fonctionnent le mieux en tandem avec une personne.

Tes questions sur la création d'images d'IA

Quelles questions as-tu sur la création d'images et de graphiques avec l'IA ? N'hésite pas à utiliser la fonction de commentaire. Tu veux être informé des nouveaux articles sur le design web et l'IA ? Alors suis-nous sur Twitter, Facebook, LinkedIn ou via notre newsletter.

As-tu aimé cet article ?

Tes évaluations nous permettent d'améliorer encore plus notre contenu.

Laisse un commentaire

Ton adresse e-mail ne sera pas publiée. Les champs obligatoires sont marqués d'un *.