Kæmper du med AI eller full-stack-udvikling? Vores eksperter er her for at vejlede dig: skræddersyet rådgivning, teknisk integration og meget mere. Kontakt os på [email protected].

Effektivt brug af tekst til billede med stabil diffusion, DALL-E 2 / MidJourney-alternativet

Det er muligt at udnytte AI til at generere billeder ud fra tekst (også kendt som tekst til billede). Stable Diffusion fra Stability AI er den bedste AI-model med åben kildekode til billedgenerering og et godt alternativ til DALL-E 2 eller MidJourney. Men korrekt brug af denne model kræver lidt øvelse, så lad os vise dig, hvordan du genererer fantastiske billeder med Stable Diffusion!

DALL-E 2 og MidJourney

DALL-E 2, der er udgivet af OpenAI, er en kraftfuld AI-model til tekst til billede. Men den er stadig i lukket betaversion i skrivende stund, hvilket betyder, at du skal bede om en særlig adgang for at bruge den.

Med DALL-E 2 kan du enten generere realistiske billeder, der ligner et rigtigt fotografi, eller generere mere abstrakte billeder, der kan ligne tegninger, malerier eller computergenererede billeder.

MidJourney er også en fantastisk god kandidat til tekst til billede, og det er især populært til AI-kunstgenerering.

Hvordan genererer du sådanne billeder? Simpelthen ved at oprette en tekstinstruktion i naturligt sprog. Her er et par eksempler:

Konceptkunst af en futuristisk by ved solnedgang.

Konceptkunst af en futuristisk by ved solnedgang, genereret af Stable Diffusion

Fotografi af en gorilla på gaden.

Foto af en gorilla på gaden, genereret af Stable Diffusion

Stabil diffusion

Stable Diffusion er en open source tekst til billede-model, der er skabt af et selskab af forskere kaldet Stability AI (se deres websted her).

Stable Diffusion er den første AI-model med åben kildekode, der opnår samme ydeevne som DALL-E 2 og MidJourney. Den giver præcise resultater, samtidig med at den holder responstiden ret lav.

Stable Diffusion er nu tilgængelig på NLP Cloud! Men det kræver lidt øvelse at få mest muligt ud af denne fantastiske AI-model, og du kan blive skuffet over dine første resultater.

Derfor syntes vi, at det ville være interessant at give dig flere oplysninger om, hvordan du bruger disse tekst til billede-modeller.

Den naive tilgang

Ved første øjekast vil du måske bruge meget enkle instruktioner som f.eks. "en bil" eller "en løve". Dette ville ikke nødvendigvis give fantastiske resultater. Her er nogle eksempler:

En bil

En bil, fremstillet ved stabil diffusion

En løve

En løve, skabt af stabil diffusion

Det er ikke dårligt, men vi kan gøre det meget bedre!

Vælg en teknik

Den nemmeste og mest imponerende forbedring, du kan foretage, er at vælge en teknik til at skabe dit billede. Det kan f.eks. være oliemaleri, blyantstegning, konceptkunst, fotografi... Lad os prøve nogle eksempler:

En blyantstegning af en løve

En blyantstegning af en løve, genereret af Stable Diffusion

Et oliemaleri af en sø om vinteren

Et oliemaleri af en sø om vinteren, genereret af stabil diffusion

En konceptkunst af en cyberpunk-bil

En konceptkunst af en cyberpunk-bil, genereret af Stable Diffusion

Det er imponerende at se, hvor let det er at skabe kunst i en bestemt stil på ingen tid, ikke sandt?

Vælg en stil

Nogle gange er en teknik ikke nok til at beskrive den type billede, du gerne vil skabe. I så fald kan det være en hjælp at angive en kunstner! Her er nogle eksempler:

Et tulipanfelt af Claude Monet

En tulipanmark lavet af Claude Monet, genereret af Stable Diffusion

Et oliemaleri af en kvinde udført af Rembrandt

Et oliemaleri af en kvinde lavet af Rembrandt, genereret af stabil diffusion

Det er en god mulighed for at lave noget research om kunstnere, som du endnu ikke kender.

Udforsk

Ovenstående eksempler kan være meget nyttige, men du kan stadig gøre det bedre ved at bruge nogle specifikke nøgleord. Stability AI-holdet anbefaler, at du prøver nogle af følgende nøgleord i dine instruktioner:

Meget detaljeret, surrealisme, trending på art station, triadisk farveskema, glat, skarpt fokus, mat, elegant, det smukkeste billede nogensinde set, illustration, digital maling, mørkt, dystert, oktan render, 8k, 4k, vaskede farver, skarpe, dramatisk belysning, smuk, efterbehandling, dagens billede, omgivende belysning, episk komposition.

Der er ingen tvivl om, at du vil opdage særlige instruktioner, som ingen har prøvet før dig, og som skaber fantastiske resultater!

Du er også velkommen til at lave længere instruktioner. Du behøver ikke nødvendigvis at holde dig til én sætning. Du kan f.eks. bruge et helt afsnit i stedet.

Hvis du har brug for idéer, kan du finde nogle interessante eksempler her:

meget detaljeret futuristisk Apple iGlass computerbriller på ansigtet af menneske, cyberpunk, hånd tracking, konceptkunst, karakter kunst, studie lyn, lyse farver, indviklet, mesterværk, fotorealistisk, hyperrealistisk, skarpt fokus, høj kontrast, Artstation HQ, DeviantArt trending, 8k UHD, Unreal Engine 5
En detaljeret manga illustration karakter helkrops portræt af en mørkhåret cyborg anime mand, der har et rødt mekanisk øje, trending on artstation, digital kunst, 4 k opløsning, detaljeret, høj kvalitet, skarpt fokus, hq kunstværk, vanvittig detalje, koncept kunst, karakter koncept, karakter illustration, helkrops illustration, filmisk, dramatisk belysning
en cyberpunk zulu kriger sidder på en klippe og ser en meteor falde til jorden på afstand, af alena aenami og android jones og greg rutkowski, Trending on artstation, hyperrealisme, elegant, stiliseret, meget detaljeret digital kunst, 8k opløsning, hd, global illumination, ray tracing, strålende lys, volumetrisk belysning, detaljeret og indviklet cyberpunk ghetto miljø, renderet i octane, olie på lærred, vidvinkel, dynamisk portræt
Maskinguden genopbygger sig selv, fantasy, d & d, indviklet, detaljeret, finurlig, detaljeret, trending på artstation, trending på artstation, glat
Gammel klog munk, der guider en fortabt sjæl gennem limbo, i stil med Tomer Hanuka og Atey Ghailan, levende farver, trending på artstation
paul bettany som engel med vinger er dækket af vinranker og blomster og mos og står foran et smukt sommerhus, et digitalt maleri af thomas canty og thomas kincade og ross tran, art nouveau, atmosfærisk belysning, trending på artstation
konceptkunst til en bil med store skarpe pigge, malet af syd mead, høj kvalitet
Bekymret god udseende blege unge indiske læger iført amerikansk tøj uden for et hospital, portræt, elegant, indviklet, digital maleri, artstation, konceptkunst, glat, skarpt fokus, illustration, kunst af artgerm og greg rutkowski og alphonse mucha
kranie gud, nærbillede portræt, kraftfuld, indviklet, elegant, volumetrisk belysning, sceneri, digital maleri, meget detaljeret, artstation, skarpt fokus, illustration, konceptkunst, ruan jia, steve mccurry
ukrainsk pige med blåt og gult tøj nær stort ødelagt fly, konceptkunst, trend på artstation, meget detaljeret, detaljeret, indviklet, skarpt fokus, digital kunst, 8 k
skræmmende uhelligt grædende spøgelse, meget detaljeret ansigt, detaljerede træk, fantasy, kredsløb, eksplosion, dramatisk, indviklet, elegant, meget detaljeret, digital maleri, artstation, konceptkunst, glat, skarpt fokus, illustration, kunst af Gustave Dore, oktan render
Smuk og legende dame frihedsportræt, art nouveau, fantasy, holder en vase af Rene Lalique , elegant, meget detaljeret, skarpt fokus, kunst af Artgerm og Greg Rutkowski og WLOP
et portræt af en kvinde, der er en repræsentation af argentinsk kultur, buenos aires, fantasy, indviklet, meget detaljeret, digitalt maleri, artstation, konceptkunst, glat, skarpt fokus, illustration, kunst af artgerm og greg rutkowski og alphonse mucha
Maleri af Greg Rutkowski, om natten flyver en stor keramisk kande med guldornamenter højt på nattens mørkeblå himmel over et lille hvidt hus under et stråtag, stjerner på himlen, rige maleriske farver.
pizza party i en forlystelsespark, lysstøv, storslået, nærbillede, detaljer, skarpt fokus, elegant, meget detaljeret, illustration, af Jordan Grimmer og greg rutkowski og PiNe(パイネ) og 薯子Imoko og 香川悠作 og wlop og maya takamura, indviklet, smuk, Trending artstation, pixiv, digital Art
Studio fotografi af hyperrealistisk præcis portræt skulptur af timothy dalton, smukke symmetrisk!! ansigt præcis ansigt detaljeret ansigt realistiske proportioner, lavet af pink matteret glas på en piedestal af ron mueck og matthew barney og greg rutkowski, hyperrealisme filmisk belysning chokerende detaljer 8 k

Konklusion

Som du kan se, er billedgenerering en meget imponerende teknik, som er blevet demokratiseret af modeller som DALL-E 2 eller MidJourney og Stable Diffusion.

Når du først mestrer teknikkerne til tekst til billede, kan du nemt generere tonsvis af fantastiske billeder på et øjeblik.

Jeg håber, du fandt det nyttigt! Hvis du har nogle spørgsmål om, hvordan du laver den mest stabile diffusion, kan du ikke tøve med at spørge os.

Julien Salinas
CTO hos NLP Cloud