Afbeeldingen met AI-tools genereren

Als het gaat om generatieve AI, krijgt het onderwerp teksten vaak de meeste aandacht. Zie mijn gids voor het maken van tekst met AI. Maar de vooruitgang op het gebied van afbeeldingen en grafieken is net zo spannend. En met video krijg je vandaag een voorproefje van wat er in de niet zo verre toekomst mogelijk is. In dit artikel geef ik je een overzicht van de mogelijkheden en beperkingen van visuele AI.

Afbeeldingen, grafieken en video's voegen een enorme waarde toe aan online content. Ze trekken meer aandacht en kunnen een onderwerp niet alleen uitleggen, maar ook emotioneren. Dit geeft je de kans om je merk en bedrijfsidentiteit te laten zien en je te onderscheiden van de massa.

Tot nu toe hadden degenen die visuele content nodig hadden de volgende opties:

1. creëer het zelf. Naast talent en kennis heb je de juiste hulpmiddelen en tijd nodig om ze te implementeren. Dit is waarschijnlijk in veel gevallen niet realistisch.

2. iemand inhuren. Dit is zeker de optie met de hoogste kwaliteit: je zoekt een geschikte specialist. De resultaten zijn hier meestal het beste, omdat je de visuals op maat laat maken. Het zal je echter niet verbazen dat de kosten hier ook het hoogst zijn.

3. stockfoto's. Je kunt platforms zoals Shutterstock, Adobe Stock of Depositphotos gebruiken. Ze bieden een grote selectie, zijn van goede kwaliteit en betaalbaar. Er zijn zelfs gratis aanbiedingen zoals Pexels of Pixelio. Nadeel: Je krijgt kant-en-klare foto's en afbeeldingen die anderen ook gebruiken. Aanpassen is meestal niet mogelijk. Die moet je zelf maken of laten maken.

AI afbeeldingen voorbeeld — De eerste poging: Een bijdrage foto door Dall-E voor dit bericht

Op het eerste gezicht lijken AI-afbeeldingsgeneratoren een spannend nieuw alternatief. Ze leveren immers snel en eenvoudig visuele content met behulp van tekstcommando's. In theorie kun je tegen lage kosten of zelfs gratis een precies passende visualisatie genereren.

Bekende AI beeldgeneratoren zijn Dall-E van OpenAI, dat ook achter ChatGPT, MidJourney en Stable Diffusion zit. Ze hebben allemaal een gratis en betaald aanbod. Stable Diffusion is open source en daarom is er al een actieve community rondom deze tool ontstaan. Dit betekent dat je Stable Diffusion direct op je eigen computer kunt gebruiken - of zelfs op een smartphone of tablet.

Waar AI-aanbiedingen voor afbeeldingen goed voor zijn

Deze beeldgeneratoren maken werken in allerlei stijlen: illustraties, tekeningen, foto's, computerafbeeldingen of zelfs het uiterlijk van een olieverfschilderij. De grenzen worden bepaald door het trainingsmateriaal, je verbeelding en je vaardigheid en doorzettingsvermogen in de zoektocht naar het perfecte resultaat.

En dat brengt ons bij een zwak punt van deze aanbiedingen zodra je ze daadwerkelijk zelf uitprobeert: het is niet altijd zo eenvoudig als gehoopt om het gewenste resultaat te bereiken. Het gebeurt in ieder geval niet "met één druk op de knop", zoals vaak wordt beschreven en beloofd. Soms heb je geluk en is het snel raak. Soms trek je je haren uit je hoofd omdat het maar niet wil lukken.

Na verloop van tijd zul je leren hoe je de beste resultaten kunt bereiken. Het centrale element hierbij is de prompt, d.w.z. de schriftelijke instructie aan de AI-tool. Wat daar goed werkt, hangt echter sterk af van de tool.

Dall-E 3 is bijvoorbeeld erg krachtig, maar ChatGPT staat tussen jou en de toepassing in. Net als bij tekst leg je dus in natuurlijke taal uit wat je in gedachten hebt. ChatGPT ontvangt dit en vertaalt het naar een instructie voor Dall-E. Als het resultaat je niet bevalt, leg je uit wat er veranderd moet worden. En zo gaat het maar door.

Aan de andere kant van het spectrum staat Stable Diffusion. Zelfs als je het gebruikt via de commerciële toepassing DreamStudio, heb je verschillende handmatige opties. Je krijgt nog meer vrijheid als je Stable Diffusion gebruikt via een interface op je eigen computer, zoals Automatic1111 of Draw Things.

Om het zo uit te leggen: Dall-E is macOS, Stable Diffusion is Linux. Dall-E produceert vrij snel goede resultaten. Daar staat tegenover dat je moet accepteren dat het systeem beperkingen oplegt aan wat je kunt doen en hoe je het kunt doen. Stable Diffusion daarentegen is in eerste instantie verwarrend en complex. Er is echter enorm veel mogelijk en je kunt een aantal hefbomen gebruiken.

AI afbeeldingen Voorbeeld zwart-wit — De tweede poging met de prompt: "Minder kleurrijk graag".

Misschien kan MidJourney dan de derde in de groep worden voor Windows. Ik moet echter toegeven dat de interface van MidJourney binnen de Discourse chatdienst me helemaal niet bevalt. Wat dat betreft heb ik er maar zeer beperkte ervaring mee. Tegelijkertijd is MidJourney behoorlijk populair omdat je met weinig moeite geweldige resultaten kunt bereiken. Op dit moment gebruik ik echter liever Dall-E 3 via ChatGPT.

Typische uitdagingen en fouten

Een fout die ik steeds weer zie is dat mensen te vaak proberen fotorealistische afbeeldingen te maken. Naar mijn mening is dit om twee redenen niet ideaal:

De resultaten zien er vaak nog kunstmatiger uit dan de stockfoto's waarop ze gebaseerd zijn. Daarnaast is er vaak een gebrek aan fijnafstemming voor het uiterlijk van de afbeeldingen. Dit komt omdat stockfoto's meestal zo neutraal mogelijk zijn ontworpen, waardoor ze zowel flexibel in gebruik als saai zijn. Foto's worden interessant door de compositie, de belichting, het spel met scherpte en onscherpte. Als je geen specificaties maakt, hebben AI tools de neiging om iets middelmatigs te produceren.
Problemen en fouten in het beeld vallen eerder op, terwijl ze in andere stijlen doorgaan voor een uiting van "creatieve vrijheid". Een technische term hiervoor is "uncanny valley": het punt waarop een bijna correct menselijk gezicht er verontrustend uitziet door een klein foutje.

Daarom vertrouw ik vaak op illustraties en afbeeldingen. Dat betekent niet dat fotorealistische afbeeldingen helemaal niet nuttig zijn. Maar het is goed om andere opties in gedachten te hebben.

Ongeacht de stijl is het belangrijk om de beperkingen van de gereedschappen te begrijpen. Deze kunnen soms verrassend zijn. Het ene motief kan meteen werken, terwijl een ander idee zelfs na tientallen pogingen niet werkt. Dit heeft vaak te maken met wat de AI weet van zijn trainingsmateriaal. Het kan beelden creëren die nog nergens anders bestaan.

Maar je moet je ook realiseren dat deze gereedschappen niet het minste begrip hebben van wat ze afbeelden. Ze hebben geen idee van de wereld in het algemeen of bijvoorbeeld van de menselijke anatomie in het bijzonder.

AI Afbeeldingen Fotorealistisch Voorbeeld — Fotorealisme werkt nog niet echt

Handen zijn een bekend voorbeeld van dit probleem. Dall-E of Stable Diffusion weten niet hoe een menselijke hand eruit ziet of hoe hij werkt. Ze hebben wel handen gezien tijdens de training. Maar soms zijn ze alleen vanaf de zijkant zichtbaar, gedeeltelijk verborgen of liggen twee handen op elkaar. De AI begrijpt niet dat een gemiddelde menselijke hand vijf vingers heeft en dat die soms, door perspectief of andere omstandigheden, niet allemaal zichtbaar zijn.

Complexe scènes zijn ook moeilijk. Voorbeeld: je wilt een foto die een team van vijf mensen laat zien en je hebt specifieke ideeën over hoe elke persoon eruit moet zien. Veel succes daarmee! Ik hoop dat je de tijd en het geduld hebt ...

De situatie is vergelijkbaar als een persoon een duidelijk gedefinieerde pose moet aannemen of als je een exacte beeldcompositie in gedachten hebt. In dit geval helpt het om niet alleen een afbeelding te maken van een prompt, maar ook van een sjabloon (bekend als "beeld naar beeld" in tegenstelling tot "tekst naar beeld"). Stable Diffusion heeft ook de ControlNet helper, die je kunt gebruiken om specifieke elementen van een sjabloon te bepalen die in de nieuwe afbeelding moeten verschijnen.

Zoals je op dit punt kunt zien, hoe hoger je verwachtingen en hoe gedetailleerder je idee, hoe moeilijker het zal zijn. Het werkt echter goed als je je laat inspireren door de AI: Je beschrijft bijvoorbeeld aan ChatGPT het doel waarvoor je de afbeelding nodig hebt en wat het moet voorstellen en vervolgens kijk je in hoeverre het resultaat je bevalt en benader je het stap voor stap. Met Stable Diffusion daarentegen experimenteer je met de prompt, maar ook met talloze andere opties en instellingen.

De problematische aspecten van beeldgeneratoren

Dit is echter niet de enige uitdaging. Een andere is dat deze AI's laten zien wat er in het trainingsmateriaal te vinden is. En daar horen vooroordelen en clichés bij. Denk hierbij aan stereotype genderrollen of zelfs racistische wereldbeelden. Uiteindelijk is het jouw verantwoordelijkheid om zulke problematische voorstellingen te herkennen en te verwijderen. ChatGPT en Dall-E proberen dit actief te voorkomen.

Een ander punt betreft het "trainingsmateriaal" dat al verschillende keren is genoemd. Net als tekstgeneratoren hebben ook deze tools hun vaardigheden geleerd van menselijke modellen. Ze zijn gevoed met een enorme hoeveelheid gegevens. Of deze foto's, afbeeldingen, illustraties, schilderijen en andere werken hiervoor gebruikt mochten worden, is een veelbesproken vraag.

"*" geeft verplichte velden aan

Sommigen zien het als inbreuk op het auteursrecht. Anderen vergelijken het met hoe artiesten van vlees en bloed leren van rolmodellen en trends volgen. Het zou te ver voeren om hier op de discussie in te gaan. Sommige aanbieders, zoals Adobe, gebruiken hun eigen aanbod van stockfoto's voor hun tools en geven ook een vergoeding voor dit gebruik. Dit zou het geschikt moeten maken voor de commerciële sector en vooral voor bedrijven.

Vooruitblik: Van beeld naar bewegend beeld

Het volgende spannende gebied voor AI-tools is al in opkomst: video. Er zijn hier een aantal nieuwe aanbiedingen die ofwel een tekstinvoer als uitgangspunt nemen of een afbeelding.

De kwaliteit van de resultaten is verbluffend. De clips zijn echter nog steeds erg kort. Typische artefacten en eigenaardigheden van de AI beeldgeneratoren kun je hier ook vinden. Op dit moment lijken ze het beste te werken met relatief statische scènes. Hoe complexer het wordt, hoe groter de kans dat er absurde details in sluipen.

Tegelijkertijd waren tekst- en afbeeldingsgeneratoren nog niet zo lang geleden op een vergelijkbaar punt. Een paar jaar geleden vonden we het bijvoorbeeld nog fascinerend dat elke portretfoto gemaakt kon worden. Tegenwoordig klagen we als een detail in onze fotorealistische uitvoer niet honderd procent correct is.

In dit opzicht is de hoop gerechtvaardigd dat deze hulpmiddelen zich de komende maanden en jaren merkbaar zullen ontwikkelen. Voorbeelden

Dus terwijl videogeneratoren nog ver weg zijn, denk ik dat afbeeldingsgeneratoren vandaag de dag al nuttig en zinvol zijn. Ze hebben hun beperkingen en problemen. Ze vervangen geen handmatig gemaakte foto's of afbeeldingen. Ze bieden eerder een andere optie en in creatieve handen kunnen ze een nuttig hulpmiddel zijn.

Ik zie ze op hetzelfde niveau als de huidige tekstgeneratoren: ze ondersteunen en inspireren soms. Ze werken het beste in combinatie met een persoon.

Jouw vragen over het maken van AI-afbeeldingen

Welke vragen heb je over het maken van afbeeldingen en grafieken met AI? Gebruik gerust de commentaarfunctie. Wil je op de hoogte blijven van nieuwe artikelen over webdesign en AI? Volg ons dan op Twitter, Facebook, LinkedIn of via onze nieuwsbrief.

Inhoudsopgave

Afbeeldingen met AI-tools genereren

Waar AI-aanbiedingen voor afbeeldingen goed voor zijn

Typische uitdagingen en fouten

De problematische aspecten van beeldgeneratoren

Vooruitblik: Van beeld naar bewegend beeld

Jouw vragen over het maken van AI-afbeeldingen

Vond je het artikel leuk?

Met jouw beoordeling help je ons om onze inhoud nog verder te verbeteren.

Jan Tissler

Laat een reactie achter Annuleer antwoord