Concept art μιας φουτουριστικής πόλης κατά τη διάρκεια του ηλιοβασιλέματος.
Είναι δυνατή η αξιοποίηση της τεχνητής νοημοσύνης για τη δημιουργία εικόνων από κείμενο (γνωστή και ως μετατροπή κειμένου σε εικόνα). Το Stable Diffusion, από την Stability AI, είναι το καλύτερο μοντέλο τεχνητής νοημοσύνης ανοικτού κώδικα για τη δημιουργία εικόνων και μια εξαιρετική εναλλακτική λύση για το DALL-E 2 ή το MidJourney. Αλλά η σωστή χρήση αυτού του μοντέλου απαιτεί λίγη εξάσκηση, οπότε ας σας δείξουμε πώς να δημιουργείτε εκπληκτικές εικόνες με το Stable Diffusion!
Το DALL-E 2, που κυκλοφόρησε από την OpenAI, είναι ένα ισχυρό μοντέλο τεχνητής νοημοσύνης για τη μετατροπή κειμένου σε εικόνα. Όμως, μέχρι τη στιγμή που γράφονται αυτές οι γραμμές, βρίσκεται ακόμα σε κλειστή beta έκδοση, πράγμα που σημαίνει ότι πρέπει να ζητήσετε ειδική πρόσβαση για να το χρησιμοποιήσετε.
Με το DALL-E 2 μπορείτε είτε να δημιουργήσετε ρεαλιστικές εικόνες που μοιάζουν με μια πραγματική φωτογραφία, είτε να δημιουργήσετε πιο αφηρημένες εικόνες που μοιάζουν με σχέδια, πίνακες ζωγραφικής ή εικόνες που δημιουργούνται από υπολογιστή.
Το MidJourney είναι επίσης ένας πολύ καλός υποψήφιος για τη μετατροπή κειμένου σε εικόνα και είναι ιδιαίτερα δημοφιλές για τη δημιουργία τέχνης AI.
Πώς δημιουργείτε τέτοιες εικόνες; Απλά δημιουργώντας μια οδηγία κειμένου σε φυσική γλώσσα. Ακολουθούν μερικά παραδείγματα:
Concept art μιας φουτουριστικής πόλης κατά τη διάρκεια του ηλιοβασιλέματος.

Φωτογραφία ενός γορίλα στο δρόμο.

Το Stable Diffusion είναι ένα μοντέλο μετατροπής κειμένου σε εικόνα ανοικτού κώδικα, που δημιουργήθηκε από μια εταιρεία ερευνητές που ονομάζεται Stability AI (δείτε την ιστοσελίδα τους εδώ).
Το Stable Diffusion είναι το πρώτο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα που επιτυγχάνει τις ίδιες επιδόσεις με το DALL-E 2 και το MidJourney. Επιστρέφει ακριβή αποτελέσματα διατηρώντας παράλληλα τον χρόνο απόκρισης αρκετά χαμηλό.
Το Stable Diffusion είναι τώρα διαθέσιμο στο NLP Cloud! Όμως, για να αξιοποιήσετε στο έπακρο αυτό το σπουδαίο μοντέλο τεχνητής νοημοσύνης χρειάζεται λίγη εξάσκηση και μπορεί να απογοητευτείτε από τα πρώτα σας αποτελέσματα.
Γι' αυτό το λόγο σκεφτήκαμε ότι θα ήταν ενδιαφέρον να σας δώσουμε περισσότερες λεπτομέρειες σχετικά με τον τρόπο χρήσης αυτών των μοντέλων μετατροπής κειμένου σε εικόνα.
Εκ πρώτης όψεως, μπορεί να θέλετε να χρησιμοποιήσετε πολύ απλές οδηγίες όπως "ένα αυτοκίνητο" ή "ένα λιοντάρι". Αυτό δεν θα επέστρεφε απαραίτητα εκπληκτικά αποτελέσματα. Ακολουθούν μερικά παραδείγματα:
Ένα αυτοκίνητο

Ένα λιοντάρι

Αυτό δεν είναι κακό, αλλά μπορούμε να το κάνουμε πολύ καλύτερα!
Η ευκολότερη και πιο εντυπωσιακή βελτίωση που μπορείτε να κάνετε είναι να επιλέξετε μια τεχνική δημιουργίας για την εικόνα σας. Για παράδειγμα, θα μπορούσε να είναι ελαιογραφία, σχέδιο με μολύβι, concept art, φωτογραφία... Ας δοκιμάσουμε μερικά παραδείγματα:
Σχέδιο με μολύβι ενός λιονταριού

Μια ελαιογραφία μιας λίμνης το χειμώνα

Ένα concept art ενός cyberpunk αυτοκινήτου

Είναι εντυπωσιακό να βλέπεις πόσο εύκολο είναι να δημιουργήσεις τέχνη που ακολουθεί ένα συγκεκριμένο στυλ σε χρόνο μηδέν, έτσι δεν είναι;
Μερικές φορές μια τεχνική δεν είναι αρκετή για να περιγράψει το είδος της εικόνας που θέλετε να δημιουργήσετε. Σε αυτή την περίπτωση, ο προσδιορισμός ενός καλλιτέχνη μπορεί να βοηθήσει! Ακολουθούν μερικά παραδείγματα:
Ένα χωράφι με τουλίπες από τον Claude Monet

Μια ελαιογραφία μιας γυναίκας που φιλοτεχνήθηκε από τον Ρέμπραντ

Είναι μια καλή ευκαιρία να κάνετε κάποια έρευνα για καλλιτέχνες που δεν γνωρίζετε ακόμα.
Τα παραπάνω παραδείγματα μπορεί να είναι πολύ χρήσιμα, αλλά μπορείτε να τα καταφέρετε καλύτερα χρησιμοποιώντας κάποιες συγκεκριμένες λέξεις-κλειδιά. Η ομάδα Stability AI συνιστά να δοκιμάσετε κάποιες από τις παρακάτω λέξεις-κλειδιά στις οδηγίες σας:
Εξαιρετικά λεπτομερής, σουρεαλισμός, τάση στο σταθμό τέχνης, τριαδικό χρωματικό σχήμα, ομαλή, ευκρινής εστίαση, ματ, κομψή, η πιο όμορφη εικόνα που είδα ποτέ, εικονογράφηση, ψηφιακή ζωγραφική, σκοτεινό, ζοφερό, απόδοση οκτανίων, 8k, 4k, πλυμένα χρώματα, αιχμηρό, δραματικός φωτισμός, όμορφο, μετα-επεξεργασία, εικόνα της ημέρας, φωτισμός περιβάλλοντος, επική σύνθεση.
Δεν υπάρχει αμφιβολία ότι θα ανακαλύψετε ειδικές οδηγίες που κανείς δεν έχει δοκιμάσει ποτέ πριν από εσάς και που δημιουργούν εκπληκτικά αποτελέσματα!
Επίσης, μπορείτε να δημιουργήσετε μεγαλύτερες οδηγίες. Δεν είναι απαραίτητο να μείνετε σε μία πρόταση. Μπορείτε, για παράδειγμα, να χρησιμοποιήσετε μια ολόκληρη παράγραφο.
Αν χρειάζεστε ιδέες, ορίστε μερικά ενδιαφέροντα παραδείγματα:
εξαιρετικά λεπτομερή φουτουριστικά γυαλιά υπολογιστή Apple iGlass στο πρόσωπο του ανθρώπου, cyberpunk, παρακολούθηση χεριών, concept art, character art, studio lightning, φωτεινά χρώματα, περίπλοκο, αριστούργημα, φωτορεαλιστικό, υπερρεαλιστικό, έντονη εστίαση, υψηλή αντίθεση, Artstation HQ, DeviantArt trending, 8k UHD, Unreal Engine 5
Ένα λεπτομερές manga εικονογράφηση χαρακτήρα πλήρες πορτρέτο του σώματος ενός σκούρα μαλλιά cyborg anime άνθρωπος που έχει ένα κόκκινο μηχανικό μάτι, trending on artstation, ψηφιακή τέχνη, 4 k ανάλυση, λεπτομερής, υψηλής ποιότητας, αιχμηρή εστίαση, hq έργο τέχνης, τρελή λεπτομέρεια, concept art, έννοια του χαρακτήρα, έννοια του χαρακτήρα, εικονογράφηση χαρακτήρα, πλήρη απεικόνιση του σώματος, κινηματογραφική, δραματικό φωτισμό
ένας cyberpunk πολεμιστής Ζουλού που κάθεται σε ένα βράχο και παρακολουθεί από μακριά έναν μετεωρίτη να πέφτει στη γη, από την alena aenami και τους android jones και greg rutkowski, Trending on artstation, υπερρεαλισμός, κομψό, στυλιζαρισμένο, εξαιρετικά λεπτομερές ψηφιακό έργο τέχνης, ανάλυση 8k, hd, global illumination, ray tracing, ακτινοβόλο φως, ογκομετρικός φωτισμός, λεπτομερές και περίπλοκο περιβάλλον cyberpunk γκέτο, rendered in octane, λάδι σε καμβά, ευρεία γωνία, δυναμικό πορτρέτο
Machine god rebuilding itself, φαντασία, d & d, περίπλοκη, λεπτομερής, ιδιότροπος, λεπτομερής, trending on artstation, trending on artstation, ομαλή
Γέρος σοφός μοναχός που καθοδηγεί μια χαμένη ψυχή μέσα από το Limbo, στο στυλ των Tomer Hanuka και Atey Ghailan, ζωντανά χρώματα, trending στο artstation
paul bettany ως άγγελος με φτερά είναι καλυμμένος με αμπέλια και λουλούδια και βρύα και στέκεται μπροστά από ένα όμορφο εξοχικό σπίτι, μια ψηφιακή ζωγραφική από thomas canty και thomas kincade και ross tran, art nouveau, ατμοσφαιρικός φωτισμός, τάση στο artstation
concept art για ένα αυτοκίνητο τεράστιες αιχμηρές αιχμές, ζωγραφισμένο από τον syd mead, υψηλής ποιότητας
Ανήσυχοι όμορφοι χλωμοί νεαροί ινδοί γιατροί που φορούν αμερικανικά ρούχα έξω από ένα νοσοκομείο, πορτρέτο, κομψό, περίπλοκο, ψηφιακή ζωγραφική, artstation, concept art, ομαλή, ευκρινής εστίαση, εικονογράφηση, τέχνη από artgerm και greg rutkowski και alphonse mucha
κρανίο θεός, close - up πορτρέτο, powerfull, περίπλοκη, κομψή, ογκομετρικός φωτισμός, τοπίο, ψηφιακή ζωγραφική, πολύ λεπτομερής, artstation, ευκρινής εστίαση, εικονογράφηση, concept art, ruan jia, steve mccurry
Ουκρανικό κορίτσι με μπλε και κίτρινα ρούχα κοντά σε μεγάλο κατεστραμμένο αεροπλάνο, concept art, trending on artstation, εξαιρετικά λεπτομερής, περίπλοκη, ευκρινής εστίαση, ψηφιακή τέχνη, 8 k
τρομακτικό ανίερο φάντασμα που κλαίει, πολύ λεπτομερές πρόσωπο, λεπτομερή χαρακτηριστικά, φαντασία, κύκλωμα, έκρηξη, δραματική, περίπλοκη, κομψή, εξαιρετικά λεπτομερής, ψηφιακή ζωγραφική, artstation, concept art, ομαλή, ευκρινής εστίαση, εικονογράφηση, τέχνη του Gustave Dore, απόδοση οκτανίων
Όμορφη και παιχνιδιάρικη κυρία πορτρέτο ελευθερίας, art nouveau, φαντασία, κρατώντας ένα βάζο από τον Rene Lalique , κομψό, εξαιρετικά λεπτομερές, ευκρινής εστίαση, τέχνη από Artgerm και Greg Rutkowski και WLOP
ένα πορτρέτο μιας γυναίκας που είναι μια αναπαράσταση της αργεντίνικης κουλτούρας, Μπουένος Άιρες, φαντασία, περίπλοκη, πολύ λεπτομερής, ψηφιακή ζωγραφική, artstation, concept art, ομαλή, ευκρινής εστίαση, εικονογράφηση, τέχνη από artgerm και greg rutkowski και alphonse mucha
Ζωγραφική από τον Greg Rutkowski, τη νύχτα μια μεγάλη κεραμική κανάτα με χρυσά στολίδια πετάει ψηλά στον νυχτερινό σκούρο μπλε ουρανό πάνω από ένα μικρό λευκό σπίτι κάτω από μια αχυρένια στέγη, αστέρια στον ουρανό, πλούσια γραφικά χρώματα.
pizza party at a theme park, light dust, magnificent, close up, details, sharp focus, elegant, highly detailed, illustration, by Jordan Grimmer and greg rutkowski and PiNe(パイネ) and 薯子Imoko and 香川悠作 and wlop and maya takamura, intricate, beautiful, Trending artstation, pixiv, digital Art
Φωτογραφία στούντιο υπερρεαλιστικό ακριβές γλυπτό πορτρέτο του timothy dalton, όμορφο συμμετρικό!! πρόσωπο ακριβές πρόσωπο λεπτομερές πρόσωπο πρόσωπο ρεαλιστικές αναλογίες, κατασκευασμένο από ροζ ματ γυαλί σε ένα βάθρο από τον ron mueck και matthew barney και greg rutkowski, υπερρεαλισμός κινηματογραφικός φωτισμός συγκλονιστική λεπτομέρεια 8 k
Όπως μπορείτε να δείτε, η δημιουργία εικόνων είναι μια πολύ εντυπωσιακή τεχνική που έχει εκδημοκρατιστεί από μοντέλα όπως το DALL-E 2 ή το MidJourney και το Stable Diffusion.
Μόλις κατακτήσετε τις τεχνικές μετατροπής κειμένου σε εικόνα, μπορείτε εύκολα να δημιουργήσετε τόνους καταπληκτικών εικόνων εν ριπή οφθαλμού.
Ελπίζω να το βρήκατε χρήσιμο! Αν έχετε ερωτήσεις σχετικά με το πώς να κάνετε την πιο σταθερή διάχυση, παρακαλούμε μη διστάσετε να μας ρωτήσετε.
Julien Salinas
CTO στο NLP Cloud