Võitlevad tehisintellekti või täieliku arendusega? Meie eksperdid on siin, et teid juhendada: kohandatud nõuanded, tehniline integratsioon ja palju muud. Võtke ühendust aadressil [email protected].

Teksti tõhus kasutamine pildi jaoks stabiilse difusiooniga, DALL-E 2 / MidJourney alternatiiviga

Tehisintellekti on võimalik kasutada selleks, et tekstist pilte genereerida (tuntud ka kui tekstist pildiks). Stable Diffusion, mida pakub Stability AI, on parim avatud lähtekoodiga tehisintellekti mudel pildi genereerimiseks ja suurepärane alternatiiv DALL-E 2 või MidJourney'le. Kuid selle mudeli õige kasutamine nõuab veidi harjutamist, seega näitame teile, kuidas Stable Diffusioniga hämmastavaid pilte genereerida!

DALL-E 2 ja vahepealne reis

DALL-E 2, mille on välja andnud OpenAI, on võimas tehisintellekti mudel tekstist pildiks muutmiseks. Kuid selle kirjutamise ajal on see veel suletud beetaversioonis, mis tähendab, et selle kasutamiseks tuleb küsida spetsiaalset ligipääsu.

DALL-E 2 abil saate luua kas realistlikke pilte, mis näevad välja nagu päris foto, või abstraktsemaid pilte, mis võivad välja näha nagu joonistused, maalid või arvutiga loodud pildid.

MidJourney on ka suurepärane kandidaat tekstist pildiks ja see on eriti populaarne AI kunsti genereerimiseks.

Kuidas te selliseid pilte genereerite? Lihtsalt loomuliku keelega tekstijuhendi loomisega. Siin on paar näidet:

Futuristliku linna kontseptsioon päikeseloojangu ajal.

Futuristliku linna kontseptsioon päikeseloojangu ajal, loodud Stable Diffusion'i poolt.

Foto gorillast tänaval.

Stable Diffusion'i poolt loodud foto gorillast tänaval.

Stabiilne difusioon

Stable Diffusion on avatud lähtekoodiga tekstipildi mudel, mille on loonud firma teadlased nimega Stability AI (vaata nende veebilehte siin).

Stable Diffusion on esimene avatud lähtekoodiga tehisintellekti mudel, mis saavutab samasuguse jõudluse nagu DALL-E 2 ja MidJourney. See annab täpseid tulemusi, hoides samal ajal reageerimisaja üsna madalana.

Stable Diffusion on nüüd saadaval NLP Cloudis! Kuid selle suurepärase tehisintellekti mudeli maksimaalne ärakasutamine nõuab mõningast harjutamist ja võite oma esimestes tulemustes pettuda.

Seetõttu arvasime, et oleks huvitav anda teile rohkem üksikasju selle kohta, kuidas neid tekstist pildiks mudeleid kasutada.

Naiivne lähenemine

Esmapilgul võiksite kasutada väga lihtsaid juhiseid nagu "auto" või "lõvi". See ei annaks tingimata hämmastavaid tulemusi. Siin on mõned näited:

Auto

Stabiilse difusiooni abil loodud auto

Lõvi

Stabiilse difusiooni poolt loodud lõvi

See ei ole halb, kuid me saame palju paremini!

Valige tehnika

Kõige lihtsam ja muljetavaldavam parandamine, mida saate teha, on valida oma pildi loomiseks sobiv tehnika. Näiteks võib see olla õlimaal, pliiatsiga joonistamine, kontseptsioonikunst, foto... Proovime mõned näited:

Pliiatsiga joonistatud lõvi

Pliiatsiga joonistatud lõvi, mis on loodud Stable Diffusion'i abil.

Õlimaal järvest talvel

Õlimaal järvest talvel, mis on loodud Stable Diffusion'i poolt.

Küberpunkauto kontseptsioonikunstnik

Stable Diffusion'i loodud küberpunkauto kontseptsioonikunst.

Muljetavaldav on näha, kui lihtne on luua teatud stiili järgivat kunsti lühikese ajaga, kas pole?

Vali stiil

Mõnikord ei piisa tehnikast, et kirjeldada, millist pilti soovite luua. Sellisel juhul aitab kunstniku täpsustamine! Siin on mõned näited:

Claude Monet'i tehtud tulbipõld

Claude Monet'i tehtud tulbipõld, mis on loodud Stable Diffusion'i abil.

Rembrandti tehtud õlimaal naisest.

Rembrandti tehtud õlimaal naisest, mille on loonud Stable Diffusion

See on hea võimalus uurida kunstnikke, keda te veel ei tunne.

Avasta

Ülaltoodud näited võivad olla väga kasulikud, kuid te saate siiski paremini hakkama, kui kasutate mõnda konkreetset märksõna. Stabiilsuse AI meeskond soovitab teil proovida oma juhistes mõnda järgmistest märksõnadest:

Väga detailne, sürrealism, trendid kunstijaamas, triadiline värviskeem, sujuv, terav fookus, matt, elegantne, kõige ilusam pilt, mida kunagi nähtud, illustratsioon, digitaalne värv, tume, sünge, oktani render, 8k, 4k, pestud värvid, terav, dramaatiline valgustus, ilus, järeltöötlus, päeva pilt, ümbritsev valgustus, eepiline kompositsioon.

Pole kahtlust, et avastate erilisi juhiseid, mida keegi pole enne teid kunagi proovinud, mis loovad hämmastavaid tulemusi!

Samuti võite vabalt koostada pikemaid juhiseid. Te ei pea tingimata piirduma ühe lausega. Selle asemel võite kasutada näiteks tervet lõiku.

Kui vajate ideid, siis siin on mõned huvitavad näited:

väga detailne futuristlik Apple iGlass arvutiprillid inimese näol, cyberpunk, käe jälgimine, kontseptsioonikunst, karakterikunst, stuudiovalgustus, erksad värvid, keerukas, meistriteos, fotorealistlik, hüperrealistlik, terav fookus, kõrge kontrast, Artstation HQ, DeviantArt trendid, 8k UHD, Unreal Engine 5
Üksikasjalik manga illustratsioon tegelase kogu keha portree tumedate juustega küborgi anime mees, kellel on punane mehaaniline silm, trendid artstation, digitaalne kunst, 4 k resolutsioon, üksikasjalik, kõrge kvaliteet, terav fookus, hq kunstiteos, hullumeelne detail, kontseptsioon, tegelase kontseptsioon, tegelase illustratsioon, kogu keha illustratsioon, kinematograafiline, dramaatiline valgustus
cyberpunk zulu sõdalane istub kaljul ja vaatab eemalt meteoriidi kukkumist maa peale, autorid alena aenami ja android jones ja greg rutkowski, Trending on artstation, hüperrealism, elegantne, stiliseeritud, väga detailne digitaalne kunst, 8k resolutsioon, hd, global illumination, ray tracing, radiant light, volumetric lighting, detailne ja keerukas cyberpunk ghetto keskkond, rendered in octane, oil on canvas, wide angle, dynamic portrait
Machine god rebuilding itself, fantaasia, d & d, keerukas, üksikasjalik, kapriisne, üksikasjalik, trendid on artstation, trendid on artstation, sujuv
Vana tark munk, kes juhatab kadunud hinge läbi Limbo, Tomer Hanuka ja Atey Ghailani stiilis, elavat värvi, trendid artstationil
paul bettany kui ingel tiibadega on kaetud viinapuude ja lilled ja sammal ja seisab ilusa suvila ees, digitaalne maal Thomas Canty ja Thomas Kincade ja ross tran, juugendstiilis, atmosfääriline valgustus, trendid artstationil
kontseptsiooni kunsti auto tohutu terav piigid, maalitud syd mead, kõrge kvaliteediga
Ärevuses hea välimusega kahvatu noor india arstide seljas Ameerika riided väljaspool haiglat, portree, elegantne, keerukas, digitaalne maal, artstation, concept art, sujuv, terav fookus, illustratsioon, art by artgerm ja greg rutkowski ja alphonse mucha
kolju jumal, close - up portree, powerfull, keerukas, elegantne, mahuline valgustus, maastik, digitaalne maal, väga detailne, artstation, terav fookus, illustratsioon, kontseptsioon, ruan jia, steve mccurry
ukraina tüdruk siniste ja kollaste riietega suure hävinud lennuki lähedal, kontseptsioonikunst, trendid artstationil, väga detailne, keerukas, terav fookus, digitaalne kunst, 8 k
hirmuäratav püha nuttev kummitus, väga detailne nägu, üksikasjalikud jooned, fantaasia, vooluring, plahvatus, dramaatiline, keerukas, elegantne, väga detailne, digitaalne maal, artstation, kontseptsioonid, sujuv, terav fookus, illustratsioon, Gustave Dore'i kunst, oktane render
Ilus ja mänguline daami vabaduse portree, juugendstiilis, fantaasia, käes Rene Lalique'i vaas , elegantne, väga detailne, terav fookus, kunst Artgerm ja Greg Rutkowski ja WLOP
naise portree, mis kujutab argentiina kultuuri, Buenos Aires, fantaasia, keerukas, väga detailne, digitaalne maal, artstation, kontseptsioon, sujuv, terav fookus, illustratsioon, art by artgerm ja greg rutkowski ja alphonse mucha
Greg Rutkowski maal, öösel suur keraamiline kann kuldsete kaunistustega lendab kõrgel öises tumesinises taevas väikese valge maja kohal, mille katuse all on rohtu, taevas on tähed, rikkalikud maalilised värvid.
pitsapidu teemapargis, kerge tolm, suurepärane, lähivõtte, detailid, terav fookus, elegantne, väga detailne, illustratsioon, autorid Jordan Grimmer ja greg rutkowski ja PiNe(パイネ) ja 薯子Imoko ja 香川悠作 ja wlop ja maya takamura, keerukas, ilus, Trending artstation, pixiv, digital Art
Stuudio foto hüperrealistlik täpne portree skulptuur timothy dalton, ilus sümmeetriline!!! nägu täpne nägu üksikasjalik nägu realistlikud proportsioonid, valmistatud roosa matt klaasist pjedestaalil ron mueck ja matthew barney ja greg rutkowski, hüperrealism kinematograafiline valgustus šokeeriv detail 8 k

Kokkuvõte

Nagu näete, on pildi genereerimine väga muljetavaldav tehnika, mida on demokratiseeritud selliste mudelitega nagu DALL-E 2 või MidJourney ja Stable Diffusion.

Kui olete omandanud tekstist pildiks muutmise tehnika, saate hõlpsasti luua hulgaliselt hämmastavaid pilte ühe silmapilguga.

Loodan, et leidsite selle kasulikuks! Kui teil on küsimusi selle kohta, kuidas teha kõige Stabiilsem difusioon, siis palun ärge kartke küsida meilt.

Julien Salinas
NLP Cloudi tehnoloogiajuht