Imate težave z umetno inteligenco ali razvojem celotnega paketa? Naši strokovnjaki so vam na voljo za pomoč: prilagojeni nasveti, tehnična integracija in še več. Obrnite se na [email protected].

Učinkovita uporaba besedila v sliki s stabilno difuzijo, alternativa DALL-E 2 / MidJourney

Z umetno inteligenco je mogoče ustvariti slike iz besedila (t. i. pretvorba besedila v sliko). Stabilna difuzija podjetja Stability AI je najboljši odprtokodni model umetne inteligence za generiranje slik in odlična alternativa programom DALL-E 2 ali MidJourney. Vendar je za pravilno uporabo tega modela potrebnih nekaj vaje, zato vam pokažemo, kako ustvariti neverjetne slike z modelom Stable Diffusion!

DALL-E 2 in sredina potovanja

DALL-E 2, ki ga je izdal OpenAI, je zmogljiv model umetne inteligence za pretvorbo besedila v sliko. Vendar je med pisanjem tega članka še vedno v zaprti beta različici, kar pomeni, da morate za njegovo uporabo zaprositi za poseben dostop.

S programom DALL-E 2 lahko ustvarite realistične slike, ki so videti kot prave fotografije, ali pa bolj abstraktne slike, ki so lahko videti kot risbe, slike ali računalniško ustvarjene slike.

MidJourney je tudi odličen kandidat za pretvorbo besedila v sliko in je še posebej priljubljen za ustvarjanje umetne inteligence.

Kako ustvarite takšne slike? Preprosto z ustvarjanjem besedilnih navodil v naravnem jeziku. Tukaj je nekaj primerov:

Koncept futurističnega mesta ob sončnem zahodu.

Koncept futurističnega mesta ob sončnem zahodu, ustvarjen s programom Stable Diffusion

Fotografija gorile na ulici.

Fotografija gorile na ulici, ustvarjena s stabilno difuzijo

Stabilna difuzija

Stabilna difuzija je odprtokodni model za pretvorbo besedila v sliko, ki ga je ustvarilo podjetje raziskovalcev, imenovano Stability AI (Oglejte si njihovo spletno stran tukaj.).

Stabilna difuzija je prvi odprtokodni model umetne inteligence, ki dosega enako zmogljivost kot DALL-E 2 in MidJourney. Vrača natančne rezultate, hkrati pa ohranja precej nizek odzivni čas.

Stabilna difuzija je zdaj na voljo v oblaku NLP Cloud! Vendar je za čim boljše izkoriščanje tega odličnega modela umetne inteligence potrebno nekaj vaje in morda boste nad prvimi rezultati razočarani.

Zato smo menili, da bi bilo zanimivo, če bi vam predstavili več podrobnosti o uporabi teh modelov za pretvorbo besedila v sliko.

Naivni pristop

Na prvi pogled boste morda želeli uporabiti zelo preprosta navodila, kot sta "avto" ali "lev". To ne bi nujno prineslo neverjetnih rezultatov. Tukaj je nekaj primerov:

Avto

Avtomobil, ustvarjen s stabilno difuzijo

Lev

Lev, ustvarjen s stabilno difuzijo

To ni slabo, vendar je lahko še veliko bolje!

Izberite tehniko

Najlažja in najbolj impresivna izboljšava, ki jo lahko naredite, je izbira tehnike ustvarjanja za vašo sliko. To je lahko na primer oljna slika, risba s svinčnikom, konceptualna umetnost, fotografija... Preizkusimo nekaj primerov:

Risba leva s svinčnikom

Risba leva s svinčnikom, ustvarjena s stabilno difuzijo

Oljna slika jezera v zimskem času

Oljna slika jezera pozimi, ustvarjena s stabilno difuzijo

Koncept avtomobila cyberpunk

Idejna zasnova kibernetskega avtomobila, ki jo je ustvaril program Stable Diffusion

Navdušujoče je videti, kako enostavno je v kratkem času ustvariti nekaj umetniških del v določenem slogu, kajne?

Izberite slog

Včasih tehnika ni dovolj za opis vrste slike, ki jo želite ustvariti. V tem primeru vam lahko pomaga navedba umetnika! Tukaj je nekaj primerov:

Polje tulipanov Clauda Moneta

Polje tulipanov Clauda Moneta, ustvarjeno s stabilno difuzijo

Oljna slika ženske, ki jo je naslikal Rembrandt

Rembrandtova oljna slika ženske, ustvarjena s stabilno difuzijo

To je dobra priložnost za raziskovanje umetnikov, ki jih še ne poznate.

Raziščite

Zgornji primeri so lahko zelo uporabni, vendar lahko z uporabo nekaterih specifičnih ključnih besed dosežete še več. Ekipa Stability AI priporoča, da v svojih navodilih preizkusite nekatere od naslednjih ključnih besed:

Zelo podrobno, nadrealizem, trendi na umetniški postaji, triadna barvna shema, gladka, ostra ostrina, mat, elegantna, najlepša slika, kar ste jih kdaj videli, ilustracija, digitalna barva, temna, mračna, oktanski render, 8k, 4k, sprane barve, ostra, dramatična osvetlitev, lepa, naknadna obdelava, slika dneva, ambientalna osvetlitev, epska sestava.

Brez dvoma boste odkrili posebna navodila, ki jih nihče še ni poskusil pred vami, ki ustvarjajo neverjetne rezultate!

Prav tako lahko ustvarite daljša navodila. Ni nujno, da se držite enega stavka. Namesto tega lahko na primer uporabite celoten odstavek.

Če potrebujete ideje, je tu nekaj zanimivih primerov:

zelo podrobna futuristična računalniška očala Apple iGlass na obrazu človeka, cyberpunk, ročno sledenje, konceptna umetnost, umetnost likov, studijska strela, svetle barve, zapletena, mojstrovina, fotorealistična, hiperrealistična, ostro ostrina, visok kontrast, Artstation HQ, DeviantArt trending, 8k UHD, Unreal Engine 5
Podrobna manga ilustracija znak portret celega telesa temnolasega kiborga anime človeka, ki ima rdeče mehansko oko, trending on artstation, digitalna umetnost, ločljivost 4 k, podrobno, visoka kakovost, ostro ostrina, hq umetniško delo, nore podrobnosti, koncept umetnosti, koncept znaka, ilustracija znaka, ilustracija celega telesa, filmska, dramatična osvetlitev
kibernetski zulujski bojevnik, ki sedi na pečini in od daleč opazuje padec meteorja na zemljo, avtorji alena aenami in android jones in greg rutkowski, Trending on artstation, hiperrealizem, elegantna, stilizirana, zelo podrobna digitalna umetnost, ločljivost 8k, hd, globalna osvetlitev, sledenje žarkov, sevalna svetloba, volumetrična osvetlitev, podrobno in zapleteno okolje kibernetskega geta, prikazano v oktanu, olje na platnu, širok kot, dinamičen portret
Strojni bog se obnovi, fantazija, d & d, zapleteno, podrobno, muhasto, podrobno, trending on artstation, trending on artstation, gladko
Stari modri menih, ki vodi izgubljeno dušo skozi Limbo, v slogu Tomerja Hanuke in Ateya Ghailana, živahne barve, trendi na artstationu
Paul Bettany kot angel s krili je prekrit z vinsko trto, cvetjem in mahom in stoji pred čudovito kočo, digitalna slika thomasa cantyja in thomasa kincada in rossa tran, art nouveau, atmosferska osvetlitev, trendi na artstation
konceptualne umetnosti za avto ogromno ostre bodice, naslikal syd mead, visoke kakovosti
Anksiozni dobro videti bledi mladi indijski zdravniki, ki nosijo ameriška oblačila zunaj bolnišnice, portret, eleganten, zapleten, digitalno slikarstvo, artstation, koncept umetnosti, gladko, ostro ostrino, ilustracija, art by artgerm and greg rutkowski and alphonse mucha
Bog lobanje, portret od blizu, močan, zapleten, eleganten, volumetrična osvetlitev, pokrajina, digitalno slikarstvo, zelo podrobno, artstation, ostro ostrina, ilustracija, koncept umetnosti, Ruan Jia, Steve McCurry
ukrajinsko dekle z modrimi in rumenimi oblačili v bližini velikega uničenega letala, konceptualna umetnost, trendi na artstation, zelo podrobna, zapletena, ostra ostrina, digitalna umetnost, 8 k
strašljiv nečasten jok duh, zelo podroben obraz, podrobne značilnosti, fantazija, vezje, eksplozija, dramatično, zapleteno, elegantno, zelo podrobno, digitalno slikarstvo, artstation, koncept umetnosti, gladko, ostrina, ilustracija, umetnost Gustave Dore, oktanski render
Lepa in igriva gospa svobode portret, art nouveau, fantazija, ki drži vazo Rene Lalique , eleganten, zelo podroben, ostro ostrino, umetnost Artgerm in Greg Rutkowski in WLOP
portret ženske, ki predstavlja argentinsko kulturo, Buenos Aires, fantazija, zapleteno, zelo podrobno, digitalno slikarstvo, artstation, konceptualna umetnost, gladko, ostro ostrino, ilustracija, umetnost artgerm in greg rutkowski in alphonse mucha
Slika Greg Rutkowski, ponoči velik keramični vrč z zlatimi okraski leti visoko v nočnem temno modrem nebu nad majhno belo hišo pod slamnato streho, zvezde na nebu, bogate slikovite barve
pizza stranka v zabaviščnem parku, svetlobni prah, veličastno, od blizu, podrobnosti, ostro ostrina, elegantno, zelo podrobno, ilustracija, Jordan Grimmer in Greg Rutkowski in PiNe(パイネ) in 薯子Imoko in 香川悠作 in wlop in maya takamura, zapleteno, lepo, Trending artstation, pixiv, digital Art
Studijska fotografija hiperrealistične natančne portretne skulpture Timothyja Daltona, čudovita simetrična!! obraz natančen obraz podroben obraz realistični proporci, iz rožnatega matiranega stekla na podstavku ron mueck in matthew barney in greg rutkowski, hiperrealizem filmska osvetlitev šokantna podrobnost 8 k

Zaključek

Kot lahko vidite, je ustvarjanje slik zelo impresivna tehnika, ki so jo demokratizirali modeli, kot so DALL-E 2 ali MidJourney in stabilna difuzija.

Ko obvladate tehnike pretvorbe besedila v sliko, lahko v trenutku ustvarite več čudovitih slik.

Upam, da se vam je zdel koristen! Če imate vprašanja o tem, kako narediti najbolj stabilno difuzijo, vas prosimo, da ne oklevajte in nas vprašajte.

Julien Salinas
Tehnični direktor v podjetju NLP Cloud