Tip na Stable Diffusion 2 – jak generovat kvalitní obrázky
První dojem z testu nové verze Stable Diffusion 2 nebyl moc přesvědčivý a všechny starší prompty co dobře fungovaly u verze 1,5 generovaly ve verzi 2 hodně špatné výsledky. Po dalším zkoumání jsem vygeneroval jeden obrázek s vodoznakem webu fotobanky Dreamstime.com a bylo celkem jasné, že obrázky tohoto webu byly použity při trénování nového modelu Stable Diffusion 2. Zkusil jsem použit popisky u jednotlivých obrázků na webu dreamstime bez nějakých úprav jako prompty a vygenerované obrázky začaly vypadat hned lépe…
Bohužel nápisy, ruce a základní logika AI stále dělají problémy i v novém modelu Stable Diffusion 2, toto měl být letecký retro plakát s nápisem Bon Voyage 🙂
Ne všechny popisy fungují, některé jsou příliš vágní a obecné, ty nevygenerují podobný obrázek nebo styl jaký chcete, ale ty podrobnější popisky bez jakýchkoli úprav najednou začaly generovat mnohem kvalitnější a věrnější výsledky.
Na webu fotobanky je mnoho různých uměleckých stylů, takže lze dobře vyzkoušet, které z těchto stylů fungují i ve Stable Diffusion 2 a jak uvidíte na ukázkách níže, pokud chcete dosáhnout třeba retro malby nebo ruční černobílé kresby, jde to celkem dobře a můžete tím nahradit jména malířů, které evidentně v nové verzi SD 2 kvůli autorským právům už nefungují…
Podrobněji jsem ještě nezkoušel jestli lze stejných výsledků dosáhnout i v rozlišení 512×512, pár pokusů v 512×512 mě přišlo horších než generování v 768×768, ale chce to ještě otestovat víc.
Vygenerované obrázky pomocí Stable Diffusion 2.0
Nastavení bylo pro všechny stejné
Steps: 40, Sampler: Euler a, CFG scale: 12.5, Face restoration: GFPGAN, Size: 768x768
Negativní Prompt
stock footage watermark, close up, grainy, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, ugly, blurry, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, out of frame, ugly, extra limbs, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, mutated hands, fused fingers, too many fingers, long neck, cross-eyed, body out of frame, mutated, bad body, closed eyes
U každého vygenerované obrázku je odkaz na stránku Dreamstime.com, kde jsem pouze zkopíroval popis pod obrázkem a použil je jako prompt, (nepoužíval jsem image to image) Lépe fungují podrobnější popisy, kdy se vygeneruje poměrně podobně vypadající obrázek, všechny následující obrázky jsou vygenerované na mém PC pomocí lokálně nainstalovaného Stable Diffusion WebUI Automatic1111 s aktivním modelem 768-v-ema.ckpt
Dreamy young woman backlit by the rising sun standing on an urban rooftop playing with her gorgeous long curly hair as she stares at the camera
Orange and lemon. Still-life hand drawn with colored pencils.
Golden retriever dog zentangle stylized head freehand pencil hand drawn pattern. Zen art. Ornate vector. Print for t-shirts
I don`t know. Portrait of confused beautiful brunette young woman with curly hairstyle in casual style standing with raised arms and looking at camera. indoor studio shot isolated on pink background
Dog and Cat above white banner looking at camera
Fashion handsome man, male head, close up portrait. Young stylish guy in casual clothes, shirt with modern hair cut. Vector hand drawing
Horse head with bridle in black and white vector hand drawing illustration
Owl head watercolor illustration in grunge style
Japan Traditional japanese painting Sumi-e art Sun Mountain Temple
Traditional Japanese Geisha girl or Oriental woman. The elegant lady of Japan is pretty and beautiful and wearing a traditional kimono.
Red deer (Cervus elaphus) in winter snow. Head and antler portrait.
A cartoon illustration of Thor with an idea.
Sloth lies with crossed legs, looking right and smiling sweetly, sketch graphics color picture.
Illustration of a beautiful woman in a spontaneous, loose style. Initially created in ink, then ized and reedited.
Roaring black panther on black background,digital painting