Koncepcia futuristického mesta počas západu slnka.
Je možné využiť umelú inteligenciu na generovanie obrázkov z textu (známe aj ako prevod textu na obrázok). Stabilná difúzia od spoločnosti Stability AI je najlepší open-source model AI na generovanie obrázkov a skvelá alternatíva k DALL-E 2 alebo MidJourney. Správne používanie tohto modelu si však vyžaduje určitú prax, preto vám ukážeme, ako generovať úžasné obrázky pomocou Stable Diffusion!
DALL-E 2, ktorý vydala spoločnosť OpenAI, je výkonný model umelej inteligencie na prevod textu na obraz. V čase písania tohto článku je však stále v uzavretej beta verzii, čo znamená, že na jeho používanie musíte požiadať o špeciálny prístup.
Pomocou aplikácie DALL-E 2 môžete vytvárať buď realistické obrázky, ktoré vyzerajú ako skutočné fotografie, alebo abstraktnejšie obrázky, ktoré môžu vyzerať ako kresby, maľby alebo počítačom vytvorené obrázky.
MidJourney je tiež skvelým kandidátom na prevod textu na obrázok a je obzvlášť obľúbený na generovanie umeleckých diel AI.
Ako vytvárate takéto obrázky? Jednoducho vytvorením textovej inštrukcie v prirodzenom jazyku. Tu je niekoľko príkladov:
Koncepcia futuristického mesta počas západu slnka.

Fotografia gorily na ulici.

Stabilná difúzia je open-source model na prevod textu na obrázok, ktorý vytvorila spoločnosť výskumníkov s názvom Stability AI (pozrite si ich webovú stránku tu).
Stabilná difúzia je prvým modelom AI s otvoreným zdrojovým kódom, ktorý dosahuje rovnaký výkon ako DALL-E 2 a MidJourney. Vracia presné výsledky pri zachovaní pomerne nízkeho času odozvy.
Stabilná difúzia je teraz k dispozícii v službe NLP Cloud! Využitie tohto skvelého modelu umelej inteligencie si však vyžaduje určitú prax a prvé výsledky vás môžu sklamať.
Preto sme si mysleli, že by bolo zaujímavé poskytnúť vám podrobnejšie informácie o tom, ako používať tieto modely prevodu textu na obrázok.
Na prvý pohľad môžete použiť veľmi jednoduché pokyny, napríklad "auto" alebo "lev". To by však nemuselo priniesť úžasné výsledky. Tu je niekoľko príkladov:
Auto

Lev

Nie je to zlé, ale môžeme to urobiť oveľa lepšie!
Najjednoduchším a najpôsobivejším zlepšením, ktoré môžete urobiť, je vybrať si techniku tvorby obrazu. Môže to byť napríklad olejomaľba, kresba ceruzkou, koncept, fotografia... Vyskúšajme si niekoľko príkladov:
Kresba leva ceruzkou

Olejomaľba jazera v zime

Koncept kyberpunkového auta

Je pôsobivé vidieť, ako ľahko sa dá v okamihu vytvoriť umenie podľa určitého štýlu, však?
Niekedy technika nestačí na opísanie druhu obrazu, ktorý by ste chceli vytvoriť. V takom prípade môže pomôcť uvedenie umelca! Tu je niekoľko príkladov:
Tulipánové pole od Clauda Moneta

Olejomaľba ženy od Rembrandta

Je to dobrá príležitosť urobiť si prieskum o umelcoch, ktorých ešte nepoznáte.
Vyššie uvedené príklady môžu byť veľmi užitočné, ale aj tak môžete dosiahnuť lepšie výsledky použitím niektorých konkrétnych kľúčových slov. Tím Stability AI odporúča, aby ste vo svojich pokynoch vyskúšali niektoré z nasledujúcich kľúčových slov:
Vysoko detailné, surrealizmus, trendy na umeleckej stanici, trojitá farebná schéma, hladký, ostré zaostrenie, matný, elegantný, najkrajší obraz, aký ste kedy videli, ilustrácia, digitálna farba, tmavý, pochmúrny, oktánové vykreslenie, 8k, 4k, umyté farby, ostrý, dramatické osvetlenie, krásny, postprocesing, obrázok dňa, okolité osvetlenie, epické zloženie.
Niet pochýb o tom, že objavíte špeciálne pokyny, ktoré nikto nikdy neskúšal pred vami, ktoré vytvárajú úžasné výsledky!
Neváhajte vytvoriť aj dlhšie pokyny. Nemusíte sa nutne držať jednej vety. Namiesto toho môžete použiť napríklad celý odsek.
Ak potrebujete nápady, tu je niekoľko zaujímavých príkladov:
vysoko detailné futuristické počítačové okuliare Apple iGlass na tvári človeka, kyberpunk, sledovanie ruky, koncepčné umenie, umenie postáv, štúdiový blesk, jasné farby, zložité, majstrovské dielo, fotorealistické, hyperrealistické, ostré zaostrenie, vysoký kontrast, Artstation HQ, DeviantArt trend, 8k UHD, Unreal Engine 5
Podrobné manga ilustrácie postava celé telo portrét tmavovlasý kyborg anime muž, ktorý má červené mechanické oko, trendy na artstation, digitálne umenie, 4 k rozlíšenie, podrobné, vysoká kvalita, ostré zaostrenie, hq umelecké dielo, šialený detail, concept art, postava koncept, postava ilustrácie, celé telo ilustrácie, filmový, dramatické osvetlenie
kyberpunkový bojovník zulu sediaci na útese a sledujúci pád meteoru na zem z diaľky, autori alena aenami a android jones a greg rutkowski, Trending on artstation, hyperrealizmus, elegantné, štylizované, veľmi detailné digitálne umenie, rozlíšenie 8k, hd, globálne osvetlenie, ray tracing, žiarivé svetlo, objemové osvetlenie, detailné a zložité prostredie kyberpunkového geta, vykreslené v oktane, olej na plátne, široký uhol, dynamický portrét
Machine god rebuilding itself, fantasy, d & d, intricate, detailed, whimsical, detailed, trending on artstation, trending on artstation, smooth
Starý múdry mních, ktorý vedie stratenú dušu cez Limbo, v štýle Tomera Hanuka a Atey Ghailan, živé farby, trendy na artstation
Paul Bettany ako anjel s krídlami je pokrytý viničom a kvetmi a machom a stojí pred krásnou chalupou, digitálna maľba thomas canty a thomas kincade a ross tran, secesia, atmosférické osvetlenie, trendy na artstation
koncepčné umenie pre auto obrovské ostré hroty, maľované syd mead, vysoká kvalita
Úzkostlivý dobre vyzerajúce bledé mladé indické lekári nosia americké oblečenie mimo nemocnice, portrét, elegantný, zložité, digitálna maľba, artstation, concept art, hladký, ostré zaostrenie, ilustrácie, umenie artgerm a Greg Rutkowski a Alfons Mucha
lebka boha, zblízka portrét, silný, zložitý, elegantný, objemové osvetlenie, scenérie, digitálna maľba, veľmi podrobný, artstation, ostré zaostrenie, ilustrácia, koncept umenia, Ruan Jia, Steve McCurry
ukrajinské dievča s modrým a žltým oblečením v blízkosti veľkého zničeného lietadla, concept art, trend na artstation, veľmi detailné, zložité, ostré, digitálne umenie, 8 k
desivý nesvätý plačúci duch, veľmi detailná tvár, detailné črty, fantázia, obvody, výbuch, dramatický, zložitý, elegantný, veľmi detailný, digitálna maľba, artstation, koncept umenia, hladký, ostré zaostrenie, ilustrácia, umenie Gustave Dore, oktánové vykresľovanie
Krásny a hravý portrét dámy slobody, secesia, fantázia, drží vázu od Rene Lalique , elegantný, veľmi detailný, ostrý, umenie Artgerm a Greg Rutkowski a WLOP
portrét ženy, ktorá je reprezentáciou argentínskej kultúry, buenos aires, fantázia, zložitý, veľmi detailný, digitálna maľba, artstation, concept art, hladký, ostrý, ilustrácia, artgerm a greg rutkowski a alphonse mucha
Obraz od Grega Rutkowského, v noci veľký keramický džbán so zlatými ornamentmi letí vysoko na nočnej tmavomodrej oblohe nad malým bielym domom pod slamenou strechou, hviezdy na oblohe, bohaté malebné farby
pizza party v zábavnom parku, svetelný prach, nádherné, zblízka, detaily, ostré zaostrenie, elegantné, veľmi podrobné, ilustrácie, Jordan Grimmer a Greg Rutkowski a PiNe(パイネ) a 薯子Imoko a 香川悠作 a wlop a maya takamura, zložité, krásne, Trending artstation, pixiv, digitálne umenie
Štúdiová fotografia hyperrealistickej presnej portrétnej sochy Timothyho Daltona, krásna symetrická!! tvár presná tvár detailná tvár realistické proporcie, z ružového matného skla na podstavci od rona muecka a matthewa barneyho a grega rutkowského, hyperrealizmus filmové osvetlenie šokujúci detail 8 k
Ako vidíte, generovanie obrazu je veľmi pôsobivá technika, ktorú zdemokratizovali modely ako DALL-E 2 alebo MidJourney a Stable Diffusion.
Po zvládnutí techník prevodu textu na obrázok môžete ľahko vytvárať množstvo úžasných obrázkov v okamihu.
Dúfam, že to bolo pre vás užitočné! Ak máte nejaké otázky o tom, ako vytvoriť čo najstabilnejšiu difúziu, prosím neváhajte sa nás opýtať.
Julien Salinas
Technický riaditeľ spoločnosti NLP Cloud