Koncept futuristického města při západu slunce.
Je možné využít umělou inteligenci k vytváření obrázků z textu (známé také jako převod textu na obrázek). Stable Diffusion od společnosti Stability AI je nejlepší open-source model AI pro generování obrázků a skvělá alternativa k DALL-E 2 nebo MidJourney. Správné používání tohoto modelu však vyžaduje určitou praxi, proto vám ukážeme, jak generovat úžasné obrázky pomocí Stable Diffusion!
DALL-E 2, vydaný společností OpenAI, je výkonný model umělé inteligence pro převod textu na obraz. V době psaní tohoto článku je však stále v uzavřené beta verzi, což znamená, že k jeho používání je třeba požádat o speciální přístup.
Pomocí aplikace DALL-E 2 můžete generovat realistické obrázky, které vypadají jako skutečné fotografie, nebo abstraktnější obrázky, které mohou vypadat jako kresby, malby nebo obrázky vytvořené počítačem.
MidJourney je také skvělým kandidátem na převod textu na obrázek a je obzvláště oblíbený pro generování umělé inteligence.
Jak takové obrázky vytváříte? Jednoduše vytvořením textové instrukce v přirozeném jazyce. Zde je několik příkladů:
Koncept futuristického města při západu slunce.

Fotografie gorily na ulici.

Stable Diffusion je open-source model pro převod textu na obrázek, který vytvořila společnost výzkumníky s názvem Stability AI (viz jejich webové stránky zde).
Stable Diffusion je první open-source model umělé inteligence, který dosahuje stejného výkonu jako DALL-E 2 a MidJourney. Vrací přesné výsledky při zachování poměrně nízké doby odezvy.
Stabilní difúze je nyní k dispozici na NLP Cloud! Využití tohoto skvělého modelu umělé inteligence však vyžaduje určitou praxi a první výsledky vás mohou zklamat.
Proto jsme si mysleli, že by bylo zajímavé poskytnout vám více informací o tom, jak tyto modely převodu textu na obrázek používat.
Na první pohled se může zdát, že budete chtít použít velmi jednoduché pokyny, jako například "auto" nebo "lev". To by nemuselo nutně vrátit úžasné výsledky. Zde je několik příkladů:
Auto

Lev

To není špatné, ale můžeme to udělat mnohem lépe!
Nejjednodušším a nejpůsobivějším vylepšením, které můžete provést, je výběr techniky tvorby obrazu. Může to být například olejomalba, kresba tužkou, koncept, fotografie... Vyzkoušejme si několik příkladů:
Kresba lva tužkou

Olejomalba jezera v zimě

Koncept kyberpunkového auta

Je působivé vidět, jak snadno lze během chvilky vytvořit umění podle určitého stylu, že?
Někdy technika nestačí k popisu druhu obrazu, který chcete vytvořit. V takovém případě může pomoci zadání umělce! Zde je několik příkladů:
Tulipánové pole od Clauda Moneta

Olejomalba ženy od Rembrandta

Je to dobrá příležitost, jak si udělat průzkum umělců, které ještě neznáte.
Výše uvedené příklady mohou být velmi užitečné, ale i tak můžete dosáhnout lepších výsledků, pokud použijete některá konkrétní klíčová slova. Tým Stability AI doporučuje, abyste v pokynech vyzkoušeli některá z následujících klíčových slov:
Vysoce detailní, surrealismus, trend na umělecké stanici, triádní barevné schéma, hladký, ostré zaostření, matný, elegantní, nejkrásnější obraz, jaký kdy byl viděn, ilustrace, digitální barva, temný, ponurý, oktanové vykreslení, 8k, 4k, vymyté barvy, ostrý, dramatické osvětlení, krásný, postprocesing, obrázek dne, okolní osvětlení, epická kompozice.
Není pochyb o tom, že objevíte speciální pokyny, které nikdo nikdy před vámi nezkoušel, které vytvářejí úžasné výsledky!
Můžete také vytvořit delší pokyny. Nemusíte se nutně držet jedné věty. Místo toho můžete použít například celý odstavec.
Pokud potřebujete nápady, zde je několik zajímavých příkladů:
vysoce detailní futuristické počítačové brýle Apple iGlass na tváři člověka, kyberpunk, sledování rukou, koncepční umění, umění postav, studio lightning, jasné barvy, složité, mistrovské dílo, fotorealistické, hyperrealistické, ostré zaostření, vysoký kontrast, Artstation HQ, DeviantArt trend, 8k UHD, Unreal Engine 5
Detailní manga ilustrace charakter celého těla portrét tmavovlasého kyborga anime muže, který má červené mechanické oko, trendy na artstation, digitální umění, rozlišení 4 k, detailní, vysoká kvalita, ostré zaostření, hq umělecké dílo, šílený detail, concept art, koncept postavy, ilustrace postavy, ilustrace celého těla, filmový, dramatické osvětlení
kyberpunkový zulský válečník sedící na útesu a sledující z dálky pád meteoru na zem, autoři alena aenami a android jones a greg rutkowski, Trending on artstation, hyperrealismus, elegantní, stylizované, vysoce detailní digitální umění, rozlišení 8k, hd, globální osvětlení, ray tracing, zářivé světlo, volumetrické osvětlení, detailní a složité prostředí kyberpunkového ghetta, renderováno v oktanu, olej na plátně, široký úhel, dynamický portrét
Machine god rebuilding itself, fantasy, d & d, intricate, detailed, whimsical, detailed, trend on artstation, trend on artstation, smooth
Starý moudrý mnich provází ztracenou duši Limbem, ve stylu Tomera Hanuky a Atey Ghailana, živé barvy, trend na artstationu
paul bettany jako anděl s křídly je pokrytý liánami a květinami a mechem a stojí před krásnou chalupou, digitální malba thomase cantyho a thomase kincadea a ross tran, secese, atmosférické osvětlení, trendy na artstation.
koncepční kresba pro auto obrovské ostré hroty, maloval syd mead, vysoká kvalita
Úzkostlivý dobře vypadající bledý mladý indický lékař v americkém oblečení před nemocnicí, portrét, elegantní, složitý, digitální malba, artstation, concept art, hladký, ostré zaostření, ilustrace, art by artgerm and greg rutkowski and alphonse mucha
lebka boha, close - up portrét, silný, složitý, elegantní, objemové osvětlení, scenérie, digitální malba, velmi detailní, artstation, ostré zaostření, ilustrace, koncept umění, Ruan Jia, Steve McCurry
ukrajinská dívka s modrým a žlutým oblečením v blízkosti velkého zničeného letadla, concept art, trendy na artstation, velmi detailní, složité, ostré, digitální umění, 8 k
děsivý nesvatý plačící duch, velmi detailní obličej, detailní rysy, fantazie, obvody, výbuch, dramatický, složitý, elegantní, velmi detailní, digitální malba, artstation, koncepční umění, hladký, ostrý, ilustrace, umění Gustave Dore, oktanové vykreslování
Krásná a hravá dáma svobody portrét, secese, fantazie, drží vázu Rene Lalique , elegantní, velmi detailní, ostré zaostření, umění Artgerm a Greg Rutkowski a WLOP
portrét ženy, která je reprezentací argentinské kultury, buenos aires, fantazie, složitý, velmi detailní, digitální malba, artstation, concept art, hladký, ostrý, ilustrace, art by artgerm and greg rutkowski and alphonse mucha
Obraz od Grega Rutkowského, v noci velký keramický džbán se zlatými ornamenty letí vysoko na noční tmavě modré obloze nad malým bílým domkem pod doškovou střechou, hvězdy na obloze, syté malebné barvy.
pizza party v zábavním parku, světelný prach, nádherné, zblízka, detaily, ostré zaostření, elegantní, velmi detailní, ilustrace, Jordan Grimmer a Greg Rutkowski a PiNe(パイネ) a 薯子Imoko a 香川悠作 a wlop a Maya takamura, složité, krásné, Trending artstation, pixiv, digital Art
Ateliérová fotografie hyperrealistické přesné portrétní sochy timothyho daltona, krásná symetrická!! tvář přesná tvář detailní tvář realistické proporce, z růžového matného skla na podstavci ron mueck a matthew barney a greg rutkowski, hyperrealismus filmové osvětlení šokující detail 8 k
Jak vidíte, generování obrazu je velmi působivá technika, která byla demokratizována modely jako DALL-E 2 nebo MidJourney a Stable Diffusion.
Jakmile zvládnete techniky převodu textu na obrázek, můžete snadno vytvářet spoustu úžasných obrázků během okamžiku.
Doufám, že se vám to bude hodit! Pokud máte nějaké dotazy ohledně toho, jak vytvořit co nejstabilnější difúzi, prosím. neváhejte se nás zeptat.
Julien Salinas
Technický ředitel společnosti NLP Cloud