Sliter du med AI eller fullstack-utvikling? Ekspertene våre er her for å veilede deg: skreddersydde råd, teknisk integrasjon og mer. Ta kontakt på [email protected].

Effektiv bruk av tekst til bilde med stabil diffusjon, DALL-E 2 / MidJourney-alternativet

Det er mulig å utnytte AI for å generere bilder fra tekst (også kjent som tekst til bilde). Stable Diffusion, av Stability AI, er den beste AI-modellen med åpen kildekode for bildegenerering, og et flott alternativ til DALL-E 2 eller MidJourney. Men riktig bruk av denne modellen krever litt øvelse, så la oss vise deg hvordan du genererer fantastiske bilder med Stable Diffusion!

DALL-E 2 og MidJourney

DALL-E 2, utgitt av OpenAI, er en kraftig AI-modell for tekst til bilde. Men den er fortsatt i lukket betaversjon i skrivende stund, noe som betyr at du må be om spesiell tilgang for å bruke den.

Med DALL-E 2 kan du enten generere realistiske bilder som ser ut som et ekte fotografi, eller generere mer abstrakte bilder som kan se ut som tegninger, malerier eller datagenererte bilder.

MidJourney er også en flott kandidat for tekst til bilde, og det er spesielt populært for AI-kunstgenerering.

Hvordan genererer du slike bilder? Ganske enkelt ved å lage en tekstinstruksjon på naturlig språk. Her er et par eksempler:

Konseptkunst av en futuristisk by under solnedgang.

Konseptkunst av en futuristisk by under solnedgang, generert av Stable Diffusion.

Fotografi av en gorilla på gaten.

Fotografi av en gorilla på gaten, generert av Stable Diffusion.

Stabil spredning

Stable Diffusion er en tekst-til-bilde-modell med åpen kildekode, laget av et selskap med forskere kalt Stability AI (se nettstedet deres her).

Stable Diffusion er den første AI-modellen med åpen kildekode som oppnår samme ytelse som DALL-E 2 og MidJourney. Den gir nøyaktige resultater samtidig som responstiden er ganske lav.

Stable Diffusion er nå tilgjengelig på NLP Cloud! Men å få mest mulig ut av denne flotte AI-modellen krever litt øvelse, og du kan bli skuffet over de første resultatene dine.

Derfor tenkte vi at det ville være interessant å gi deg mer informasjon om hvordan du bruker disse tekst-til-bilde-modellene.

Den naive tilnærmingen

Ved første øyekast kan det være lurt å bruke svært enkle instruksjoner som "en bil" eller "en løve". Dette vil ikke nødvendigvis gi fantastiske resultater. Her er noen eksempler:

En bil

En bil, generert av Stable Diffusion

En løve

En løve, generert av Stable Diffusion

Dette er ikke dårlig, men vi kan gjøre det mye bedre!

Velg en teknikk

Den enkleste og mest imponerende forbedringen du kan gjøre er å velge en skapelsesteknikk for bildet ditt. Det kan for eksempel være oljemaleri, blyanttegning, konseptkunst, fotografi ... La oss prøve noen eksempler:

En blyanttegning av en løve

En blyanttegning av en løve, generert av Stable Diffusion.

Et oljemaleri av en innsjø om vinteren

Et oljemaleri av en innsjø om vinteren, generert av Stable Diffusion.

En konseptkunst av en cyberpunk-bil

En konseptkunst av en cyberpunk-bil, generert av Stable Diffusion.

Imponerende å se hvor enkelt det er å generere kunst som følger en bestemt stil på kort tid, ikke sant?

Velg en stil

Noen ganger er ikke en teknikk nok til å beskrive hva slags bilde du ønsker å skape. I så fall kan det hjelpe å spesifisere en kunstner! Her er noen eksempler:

En tulipanåker laget av Claude Monet

Et tulipanfelt laget av Claude Monet, generert av Stable Diffusion.

Et oljemaleri av en kvinne laget av Rembrandt.

Et oljemaleri av en kvinne laget av Rembrandt, generert av Stable Diffusion.

Det er en god mulighet til å gjøre litt research på kunstnere du ikke kjenner ennå.

Utforsk

Eksemplene ovenfor kan være svært nyttige, men du kan fortsatt gjøre det bedre ved å bruke noen spesifikke nøkkelord. Stability AI-teamet anbefaler at du prøver noen av følgende nøkkelord i instruksjonene dine:

Svært detaljert, surrealisme, trending på kunststasjon, triadisk fargevalg, glatt, skarpt fokus, matt, elegant, det vakreste bildet noensinne sett, illustrasjon, digital maling, mørk, dyster, oktan gjengivelse, 8k, 4k, vasket farger, skarp, dramatisk belysning, vakker, etterbehandling, dagens bilde, omgivelsesbelysning, episk komposisjon.

Ingen tvil om at du vil oppdage spesielle instruksjoner som ingen aldri har prøvd før deg som skaper fantastiske resultater!

Du kan også gjerne lage lengre instruksjoner. Du trenger ikke nødvendigvis å holde deg til én setning. Du kan for eksempel bruke et helt avsnitt i stedet.

Hvis du trenger ideer, finner du noen interessante eksempler her:

svært detaljert futuristisk Apple iGlass dataglass på ansiktet til mennesker, cyberpunk, håndsporing, konseptkunst, karakterkunst, studiolys, lyse farger, intrikat, mesterverk, fotorealistisk, hyperrealistisk, skarpt fokus, høy kontrast, Artstation HQ, DeviantArt trending, 8k UHD, Unreal Engine 5
En detaljert manga illustrasjon karakter full kropp portrett av en mørkhåret cyborg anime mann som har et rødt mekanisk øye, trending på artstation, digital kunst, 4 k oppløsning, detaljert, høy kvalitet, skarpt fokus, hq kunstverk, vanvittige detaljer, konseptkunst, karakterkonsept, karakterillustrasjon, full kroppsillustrasjon, filmisk, dramatisk belysning
a cyberpunk zulu warrior sitting on a cliff watching a meteor fall to earth from a distance, av alena aenami og android jones og greg rutkowski, Trending on artstation, hyperrealisme, elegant, stilisert, svært detaljert digital kunst, 8k oppløsning, hd, global belysning, ray tracing, strålende lys, volumetrisk belysning, detaljert og intrikat cyberpunk ghettomiljø, gjengitt i oktan, olje på lerret, vidvinkel, dynamisk portrett
Maskingud gjenoppbygger seg selv, fantasi, d & d, intrikat, detaljert, finurlig, detaljert, trending på artstation, trending på artstation, glatt
Gammel klok munk guider en tapt sjel gjennom Limbo, i stil med Tomer Hanuka og Atey Ghailan, livlige farger, trender på artstation
paul bettany som engel med vinger er dekket av vinranker og blomster og mose og står foran en vakker hytte, et digitalt maleri av thomas canty og thomas kincade og ross tran, art nouveau, atmosfærisk belysning, trending på artstation
konseptkunst for en bil store skarpe pigger, malt av syd mead, høy kvalitet
Anxious good looking bleke unge indiske leger iført amerikanske klær utenfor et sykehus, portrett, elegant, intrikat, digitalt maleri, artstation, konseptkunst, glatt, skarpt fokus, illustrasjon, kunst av artgerm og greg rutkowski og alphonse mucha
hodeskalle gud, nærbilde portrett, kraftig, intrikat, elegant, volumetrisk belysning, landskap, digitalt maleri, svært detaljert, artstation, skarp fokus, illustrasjon, konseptkunst, ruan jia, steve mccurry
ukrainsk jente med blå og gule klær nær stort ødelagt fly, konseptkunst, trender på artstation, svært detaljert, intrikat, skarpt fokus, digital kunst, 8 k
skremmende uhellig gråtende spøkelse, veldig detaljert ansikt, detaljerte funksjoner, fantasi, kretsløp, eksplosjon, dramatisk, intrikat, elegant, svært detaljert, digitalt maleri, artstation, konseptkunst, glatt, skarpt fokus, illustrasjon, kunst av Gustave Dore, oktan gjengivelse
Vakkert og lekent damefrihetsportrett, art nouveau, fantasi, holder en vase av Rene Lalique , elegant, svært detaljert, skarpt fokus, kunst av Artgerm og Greg Rutkowski og WLOP
et portrett av en kvinne som er en representasjon av argentinsk kultur, buenos aires, fantasy, intrikat, svært detaljert, digitalt maleri, artstation, konseptkunst, glatt, skarpt fokus, illustrasjon, kunst av artgerm og greg rutkowski og alphonse mucha
Maleri av Greg Rutkowski, om natten flyr en stor keramisk kanne med gull ornamenter høyt på natten mørkeblå himmel over et lite hvitt hus under et stråtak, stjerner på himmelen, rike pittoreske farger
pizzafest i en temapark, lett støv, fantastisk, nærbilde, detaljer, skarpt fokus, elegant, svært detaljert, illustrasjon, av Jordan Grimmer og greg rutkowski og PiNe (パイネ) og 薯子Imoko og 香川悠作 og wlop og maya takamura, intrikat, vakker, Trending artstation, pixiv, digital kunst
Studiofotografi av hyperrealistisk nøyaktig portrettskulptur av timothy dalton, vakker symmetrisk !!! ansikt nøyaktig ansikt detaljert ansikt realistiske proporsjoner, laget av rosa frostet glass på en pidestall av ron mueck og matthew barney og greg rutkowski, hyperrealisme filmisk belysning sjokkerende detalj 8 k

Konklusjon

Som du kan se, er bildegenerering en veldig imponerende teknikk som har blitt demokratisert av modeller som DALL-E 2 eller MidJourney og Stable Diffusion.

Når du mestrer tekst til bilde-teknikker, kan du enkelt generere tonnevis av fantastiske bilder på et øyeblikk.

Håper du fant det nyttig! Hvis du har noen spørsmål om hvordan du kan få mest mulig Stable Diffusion, vennligst ikke nøl med å spørre oss.

François
Fullstack-ingeniør hos NLP Cloud