Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Pour développer idées, projets de jeux, univers, règles et scénarios
Yusei
Dieu en cavale
Messages : 9699
Inscription : jeu. janv. 30, 2014 9:47 am
Contact :

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Yusei »

Altay a écrit : lun. nov. 28, 2022 7:29 pm Sortie de StableDiffusion v2.0 avec quelques ajouts notables :
  • l'upscale peut monter jusqu'à 2048x2048,
  • meilleure cohérence de l'édition d'image entre premier plan et arrière-plan (grâce à un modèle qui fait de l'estimation de profondeur).

Et bien sûr, des améliorations qualitatives à gauche et à droite.

Sur le subreddit dédié à StableDiffusion, les gens sont très critiques vis-à-vis de cette version, qui semble incapable de représenter des célébrités correctement, de faire référence au style d'artistes ou de faire du nu (ce qui semblait être l'utilisation majoritaire). Apparemment ils ont essayé d'éviter les ennuis en écrêmant leurs données d'entraînement.
Avatar de l’utilisateur
jbbourgoin
Dieu d'après le panthéon
Messages : 2088
Inscription : mer. juin 18, 2014 2:35 pm
Localisation : Brest
Contact :

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par jbbourgoin »

Ce qui n'est pas vraiment un problème puisque, open-source oblige, les gens peuvent toujours continuer à utiliser le modèle de la v1.5, voire utiliser d'autres modèles plus spécialisés (et les entraîner).
Avatar de l’utilisateur
Altay
Ascendant
Messages : 1518
Inscription : sam. mai 07, 2016 12:04 pm

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Altay »

Yusei a écrit : jeu. déc. 01, 2022 9:40 am Sur le subreddit dédié à StableDiffusion, les gens sont très critiques vis-à-vis de cette version, qui semble incapable de représenter des célébrités correctement, de faire référence au style d'artistes ou de faire du nu (ce qui semblait être l'utilisation majoritaire). Apparemment ils ont essayé d'éviter les ennuis en écrêmant leurs données d'entraînement.

Oui. En fait, SD a changé son modèle de langage (CLIP) pour passer de celui fourni par OpenAI mais qui était entraîné sur un jeu de données inconnu à LAION, qui est connu et qui respecte l'opt-out des artistes/célébrités/etc. qui ne veulent pas y figurer. Ça change la base de connaissances sous-jacente de StableDiffusion. À mon avis, ce n'est pas un mal du point de vue du consentement des personnes à être « injectées » dans l'espace latent d'un modèle génératif.
Avatar de l’utilisateur
Blondin
Dieu d'après le panthéon
Messages : 3723
Inscription : jeu. sept. 25, 2014 10:51 am
Localisation : Six pieds sous terre

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Blondin »

J'ai enfin réussi à obtenir quelque chose de plus ou moins correct avec Stable Diffusion. Comme quoi, le combo acteur/actrice + Tim Bradstreet, ça marche (même si c'est loin d'être parfait, on peut remarquer que la personne sur la dernière image a un "léger" problème au bras droit) !

Image

Spoiler:
1. Ian McKellen — 2. Ian McKellen — 3. Christopher Lee — 4. Alison Brie — 5. Peter Cushing — 6. je sais plus, mais rien à avoir avec ce que j'ai demandé :D
Dieu de la robe de chambre en télétravail
Joueur sur : Les Encagés (Cthulhu Hack)
Traducteur ponctuel pour Savage Torgan
Traducteur de : 24XX DRS24XX CONFRONTATION24XX CONSIGNES D'URGENCE
Auteur de : 1980 LEGION
Avatar de l’utilisateur
Vorghyrn
Dieu des gargarismes
Messages : 8749
Inscription : jeu. févr. 03, 2011 12:00 pm
Localisation : Bamako (Mali)
Contact :

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Vorghyrn »

J'ai commencé à m'amuser un peu avec Dall-E

J'ai voulu lui faire représenter mon perso à Vampire : une femme vampire portant une armure et une épée sur un fond de nuit avec un village médiéval et une horloge gothique (traduction approximative). J'ai essayé plusieurs styles (peinture médiévale, peinture de la renaissance, icône byzantine et d'autres). Grosso-modo le fond et le corps avec l'armure n'est pas mal (il ne m'a pas proposé de chainmail bikini, ouf !). Par contre ça achoppe sur le visage qui était limite du nosfératu à chaque fois. Même en retirant l'option "vampire". J'ai bien sûr essayer des variations d"une base que je trouvais pas mal, d'éditer le visage mais rien n'y a fait

Des astuces pour avoir des visages à peu près corrects (même sans les "détails vampirique")
Mon blog JDR : De l'autre Côté de l'écran. critiques de JDR et techniques de jeu, surtout en solo

"la bêtise naturelle bat l'intelligence artificielle à tous les coups" 
(Terry Pratchett)
 
Yusei
Dieu en cavale
Messages : 9699
Inscription : jeu. janv. 30, 2014 9:47 am
Contact :

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Yusei »

Vorghyrn a écrit : mar. déc. 06, 2022 6:09 pm Des astuces pour avoir des visages à peu près corrects (même sans les "détails vampirique")
Les noms de célébrités, en en mettant plusieurs si tu ne veux pas que le visage soit reconnaissable.
Avatar de l’utilisateur
Blondin
Dieu d'après le panthéon
Messages : 3723
Inscription : jeu. sept. 25, 2014 10:51 am
Localisation : Six pieds sous terre

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Blondin »

@Vorghyrn, jette un peu un œil à ce que j'ai fait, c'est plus ou moins l'astuce donnée par Yusei (mais avec une seule personne, et via Stable Diffusion).
Dieu de la robe de chambre en télétravail
Joueur sur : Les Encagés (Cthulhu Hack)
Traducteur ponctuel pour Savage Torgan
Traducteur de : 24XX DRS24XX CONFRONTATION24XX CONSIGNES D'URGENCE
Auteur de : 1980 LEGION
Avatar de l’utilisateur
Qui Revient de Loin
Dieu qui a failli y rester
Messages : 11667
Inscription : sam. mars 02, 2013 1:20 pm
Localisation : Nothing Gulch
Contact :

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Qui Revient de Loin »

Ramentu a écrit : mar. déc. 06, 2022 6:11 pm
Et on peut les piéger aisément... Après des dérives malheureuses sur des bot public, les concepteurs ont introduit des "règles d'éthique et de prudence" pour empêcher l'AI de repondre "comment faire des explosifs" ou "comment harceler quelqu'un".
Donc les petits malins demandent à L'AI un exemple de ce que serait une réponse inappropriée à une question donnée, et en avant ... On trouve des exemples assez hilarant en ligne 😀
Sur Midjourney par exemple, on peut peut demander d'illustration répondant aux termes très dangereux de prouter et péter. Farts/Fart font partis des mots interdits.

Ouf, on est sauvé.
 
Dieu qui a failli y rester | Teams Panthéon & Bienvenue
Le blog de mes voyages imaginaires: http://qui.revient.de.loin.blog.free.fr/
Mon Itchio
Mémoire de rôlistes : le patrimoine du jeu de rôle se construit aujourd'hui

Contributeur au Grog
Avatar de l’utilisateur
Vorghyrn
Dieu des gargarismes
Messages : 8749
Inscription : jeu. févr. 03, 2011 12:00 pm
Localisation : Bamako (Mali)
Contact :

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Vorghyrn »

@Yusei @Blondin : merci, en plus vos messages étaient juste au-dessus. Je me suis laissé happé par la discussion sur l'IA. J'ai commencé à tester. C'est mieux. Pas top mais mieux

Détail marrant : j'ai choisi Sophie Marceau (actrice connue et dont les photo qui pop sur google sont à peu près dans l'age et le physique de mon perso). J'ai eu le droit à une armure mais épaules nues et décolleté... :runaway Je pense qu'il va falloir en plus chercher une actrice avec un style vestimentaire adapté  8)7  

edit : beaucoup mieux avec Sigourney Weaver !
Mon blog JDR : De l'autre Côté de l'écran. critiques de JDR et techniques de jeu, surtout en solo

"la bêtise naturelle bat l'intelligence artificielle à tous les coups" 
(Terry Pratchett)
 
Avatar de l’utilisateur
Fabien_Lyraud
Dieu, sérieux les gars.
Messages : 5333
Inscription : ven. mai 05, 2006 2:09 pm

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Fabien_Lyraud »

Est ce que les analyseurs linguistique des IA gèrent bien la polysémie ? Ou est ce que l'on peut avoir des surprises?
Avatar de l’utilisateur
Altay
Ascendant
Messages : 1518
Inscription : sam. mai 07, 2016 12:04 pm

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Altay »

Fabien_Lyraud a écrit : jeu. déc. 15, 2022 6:41 pm Est ce que les analyseurs linguistique des IA gèrent bien la polysémie ? Ou est ce que l'on peut avoir des surprises?

Non et oui. Les modèles de langage récents captent le mieux le sens des mots grâce au contexte mais tu peux encore avoir des bizarreries.
Ramentu
Banni
Messages : 1341
Inscription : jeu. août 15, 2019 10:07 am
Localisation : Luxembourg

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Ramentu »

Quelque soit l'opinion sur le sujet, il faut admettre que l'approche est bien pensée :

Un artiste pas trop content de voir des images proches de ses oeuvres générées par AI "dans le style de... " a généré des images sur Midjourney inspirée de Mickey, Darth Vador, Mario, ... et les diffuse.
Son argument : puisque ce sont des oeuvres originales crées par l'AI, Disney et co n'auront certainement pas d'objections ... :mrgreen:

https://www.dailydot.com/debug/ai-art-p ... key-mouse/
Avatar de l’utilisateur
Belphégor
Dieu d'après le panthéon
Messages : 1811
Inscription : dim. avr. 02, 2017 9:48 am

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Belphégor »

Je serais bien tenté d'essayer, quel logiciel de synthèse d'image est disponible gratuitement et en ligne ? j'ai pas une carte graphique très puissante malheureusement. 
Avatar de l’utilisateur
jbbourgoin
Dieu d'après le panthéon
Messages : 2088
Inscription : mer. juin 18, 2014 2:35 pm
Localisation : Brest
Contact :

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par jbbourgoin »

Qu'as-tu comme carte graphique exactement ? J'ai une gtx 970 qui n'est plus toute jeune mais je peux faire tourner Stable Diffusion à partir d'un build spécifique, c'est peut-être à tenter sur ta config ?
Ramentu
Banni
Messages : 1341
Inscription : jeu. août 15, 2019 10:07 am
Localisation : Luxembourg

Re: Synthèse d'images (Dall-E, Imagen, Midjourney, StableDiffusion, etc.)

Message par Ramentu »

Techniquement, tu peux même faire tourner Stable Diffusion sur le processeur (version Openvino, je crois) , mais par contre ça ne va pas être rapide...

Si tu as au minimum 2G de ram sur la carte graphique (pas sur le pc, sur la carte), la version proposée par @jbbourgoin peut tourner avec des paramètres spécifiques (et en déconnectant l'accélération hardware dans ton browser, et tout les autres programmes susceptibles d'utiliser la carte graphique ...) ... mais 4G est le minimum pour du 512*512 , et 8G est plus confortable.

Tu peux aussi le faire tourner sur Google Colab, ça fonctionne parait-il très bien mais je n'ai pas testé.

Et tu as de multiples offres online, mais généralement les offres gratuites sont limitées dans les options et paramètres.
Répondre