Egy futurisztikus város koncepciója naplemente alatt.
Lehetőség van arra, hogy a mesterséges intelligenciát kihasználva szövegből képeket generáljunk (más néven text to image). A Stability AI által készített Stable Diffusion a legjobb nyílt forráskódú AI modell képgenerálásra, és nagyszerű alternatívája a DALL-E 2 vagy a MidJourney modellnek. De ennek a modellnek a megfelelő használata némi gyakorlatot igényel, ezért megmutatjuk, hogyan generálhatsz elképesztő képeket a Stable Diffusion segítségével!
Az OpenAI által kiadott DALL-E 2 egy nagy teljesítményű mesterséges intelligenciamodell a szövegből képet készítéshez. De e sorok írásakor még mindig zárt béta fázisban van, ami azt jelenti, hogy a használatához külön hozzáférést kell kérni.
A DALL-E 2 segítségével vagy realisztikus képeket generálhat, amelyek úgy néznek ki, mint egy valódi fénykép, vagy absztraktabb képeket, amelyek rajzoknak, festményeknek vagy számítógépen generált képeknek tűnhetnek.
A MidJourney szintén nagyszerű jelölt a szövegből képet készítő programra, és különösen népszerű az AI art generálásához.
Hogyan lehet ilyen képeket létrehozni? Egyszerűen egy természetes nyelvű szöveges utasítás létrehozásával. Íme néhány példa:
Egy futurisztikus város koncepciója naplemente alatt.
Fénykép egy gorilláról az utcán.
A Stable Diffusion egy nyílt forráskódú szöveg-kép modell, amelyet egy cég hozott létre a kutatók által létrehozott Stability AI (lásd a honlapjukat itt).
A Stable Diffusion az első nyílt forráskódú mesterséges intelligencia modell, amely eléri a DALL-E 2 és a MidJourney teljesítményét. Pontos eredményeket szolgáltat, miközben a válaszidő meglehetősen alacsony.
A Stable Diffusion már elérhető az NLP Cloudon! De ennek a nagyszerű mesterséges intelligencia modellnek a kihasználása némi gyakorlatot igényel, és előfordulhat, hogy csalódni fogsz az első eredményekben.
Ezért gondoltuk, hogy érdekes lenne, ha részletesebben is bemutatnánk, hogyan használhatod ezeket a szövegből képbe modelleket.
Első látásra nagyon egyszerű utasításokat használhat, mint például "egy autó" vagy "egy oroszlán". Ez nem feltétlenül adna elképesztő eredményeket. Íme néhány példa:
Egy autó
Egy oroszlán
Ez nem rossz, de sokkal jobbat is tudunk!
A legegyszerűbb és leglátványosabb javítás, amit tehet, hogy kiválasztja a kép létrehozásának technikáját. Ez lehet például olajfestmény, ceruzarajz, koncept art, fotó... Próbáljunk ki néhány példát:
Egy oroszlán ceruzarajz
Egy olajfestmény egy tóról télen
Egy cyberpunk autó koncepciója
Lenyűgöző látni, hogy milyen könnyű egy adott stílust követő művészetet létrehozni pillanatok alatt, nem igaz?
Néha egy technika nem elég ahhoz, hogy leírja, milyen képet szeretne létrehozni. Ebben az esetben a művész megadása segíthet! Íme néhány példa:
Claude Monet által készített tulipánmező
Rembrandt olajfestménye egy nőről
Ez egy jó alkalom arra, hogy kutatást végezzen olyan művészek után, akiket még nem ismer.
A fenti példák nagyon hasznosak lehetnek, de néhány konkrét kulcsszó használatával még mindig jobban járhat. A Stability AI csapata azt javasolja, hogy próbálja ki az alábbi kulcsszavak valamelyikét az utasításaiban:
Nagyon részletes, szürrealizmus, trendi a művészeti állomáson, hármas színséma, sima, éles fókusz, matt, elegáns, a legszebb kép, amit valaha láttam, illusztráció, digitális festék, sötét, komor, oktán render, 8k, 4k, mosott színek, éles, drámai megvilágítás, gyönyörű, utómunka, a nap képe, környezeti megvilágítás, epikus kompozíció.
Kétségtelen, hogy olyan különleges utasításokat fog felfedezni, amelyeket még soha senki nem próbált ki, amelyek csodálatos eredményeket hoznak létre!
Bátran készíthet hosszabb utasításokat is. Nem feltétlenül kell egy mondatnál maradnia. Használhat helyette például egy egész bekezdést is.
Ha ötletekre van szüksége, itt van néhány érdekes példa:
rendkívül részletes futurisztikus Apple iGlass számítógépes szemüveg az emberi arcon, cyberpunk, kézkövetés, concept art, karakter art, stúdió villám, élénk színek, bonyolult, remekmű, fotórealista, hiperrealista, éles fókusz, nagy kontraszt, Artstation HQ, DeviantArt trending, 8k UHD, Unreal Engine 5
Egy részletes manga illusztráció karakter teljes test portré egy sötét hajú cyborg anime férfi, aki egy piros mechanikus szem, trending artstation, digitális művészet, 4 k felbontás, részletes, kiváló minőségű, éles fókusz, hq műalkotás, őrült részlet, koncepció művészet, karakter koncepció, karakter illusztráció, teljes test illusztráció, filmszerű, drámai világítás
egy cyberpunk zulu harcos ül egy sziklán és nézi a távolból a meteor lezuhanását a földre, alena aenami és android jones és greg rutkowski, Trending on artstation, hiperrealizmus, elegáns, stilizált, rendkívül részletes digitális művészet, 8k felbontás, hd, globális megvilágítás, ray tracing, sugárzó fény, volumetrikus megvilágítás, részletes és bonyolult cyberpunk gettó környezet, renderelt oktán, olaj a vászonra, széles látószög, dinamikus portré
Gép isten újjáépíti magát, fantasy, d & d, bonyolult, részletes, szeszélyes, részletes, trendi artstation, trendi artstation, sima, sima
Öreg bölcs szerzetes, aki egy elveszett lelket vezet át a Limbón, Tomer Hanuka és Atey Ghailan stílusában, vibráló színek, trendi az artstation-on.
Paul Bettany, mint angyal szárnyakkal borított szőlő és virágok és moha és áll előtt egy gyönyörű házikó, egy digitális festmény Thomas Canty és Thomas Kincade és Ross Tran, szecesszió, hangulatos világítás, trend az artstationon
koncepció művészet egy autó hatalmas éles tüskék, festett syd mead, kiváló minőségű
Aggódó, jó megjelenésű, sápadt, fiatal indiai orvosok amerikai ruhát viselnek egy kórház előtt, portré, elegáns, bonyolult, digitális festmény, artstation, koncept art, sima, éles fókusz, illusztráció, art által artgerm és greg rutkowski és alphonse mucha
koponya isten, close - up portré, powerfull, bonyolult, elegáns, volumetrikus világítás, táj, digitális festészet, rendkívül részletes, artstation, éles fókusz, illusztráció, koncepció művészet, ruan jia, steve mccurry
ukrán lány kék és sárga ruhákkal nagy romos repülőgép mellett, koncepcióművészet, trending on artstation, rendkívül részletes, bonyolult, éles fókusz, digitális művészet, 8 k
félelmetes szentségtelen síró szellem, nagyon részletes arc, részletes vonások, fantasy, áramkör, robbanás, drámai, bonyolult, elegáns, rendkívül részletes, digitális festészet, artstation, concept art, sima, éles fókusz, illusztráció, művészet Gustave Dore, oktán renderelés
Gyönyörű és játékos hölgy szabadság portré, szecesszió, fantázia, kezében egy váza Rene Lalique , elegáns, nagyon részletes, éles fókusz, művészet Artgerm és Greg Rutkowski és WLOP
egy nő portréja, amely az argentin kultúra, Buenos Aires, fantasy, bonyolult, rendkívül részletes, digitális festészet, artstation, koncepció művészet, sima, éles fókusz, illusztráció, art által artgerm és greg rutkowski és alphonse mucha ábrázolása
Greg Rutkowski festménye, éjszaka egy nagy kerámia kancsó arany díszekkel repül magasan az éjszakai sötétkék égen egy kis fehér ház felett, nádtető alatt, csillagok az égen, gazdag festői színek.
pizza party egy vidámparkban, fénypor, csodálatos, közeli, részletek, éles fókusz, elegáns, nagyon részletes, illusztráció, Jordan Grimmer és greg rutkowski és PiNe(パイネ) és 薯子Imoko és 香川悠作 és wlop és maya takamura, bonyolult, gyönyörű, Trending artstation, pixiv, digitális művészet
Stúdió fotó hiperrealista pontos portré szobor timothy dalton, gyönyörű szimmetrikus!!! arc pontos arc részletes arc részletes arc realisztikus arányok, készült rózsaszín matt üvegből egy talapzaton ron mueck és Matthew Barney és greg rutkowski, hiperrealizmus filmes világítás sokkoló részlet 8 k
Amint láthatja, a képgenerálás egy nagyon lenyűgöző technika, amelyet az olyan modellek, mint a DALL-E 2 vagy a MidJourney és a Stable Diffusion demokratizáltak.
Ha egyszer elsajátítja a szövegből képbe technikákat, akkor egy szempillantás alatt rengeteg csodálatos képet készíthet.
Remélem, hasznosnak találtad! Ha kérdése van azzal kapcsolatban, hogyan lehet a legstabilabb diffúziót létrehozni, kérjük, válaszoljon ne habozzon, kérdezzen minket.
Julien Salinas
CTO az NLP Cloudnál