Il est possible avec Stable Diffusion XL d'obtenir des images originales et de qualité de façon relativement peu complexe. Voici 4 façons de procéder…
au sommaire
Dans l'universunivers des text-to-image (générateur d'images IA), trois applicationsapplications se disputent le leadership, celles apparues dès 2022 et parfois même un peu avant :
- Midjourney est habituellement considérée comme la meilleure du lot. Sa prise en main n'est pas aisée. Nous lui avons consacré un tutorial sur cette page.
- Dall.e 2 est le text-to-image de OpenAI, créateur de ChatGPT. Il est beaucoup moins avancé que Midjourney. Il a toutefois l'avantage d'être accessible depuis le moteur de recherche Bing, en tant que Bing Image Creator. De ce fait, un grand nombre d'utilisateurs découvrent les text-to-image via Dall.e 2. Là encore, nous avons publié un tutorial pour cette application.
- Stable DiffusionDiffusion est l'œuvre de la société Stability.ai et il est accessible à l'adresse dreamstudio.ai. Or, depuis avril 2023, une nouvelle version est apparue, Stable Diffusion XL. Si l'on prend soin d'utiliser cette version exacte, on a alors affaire à un outil d'une qualité proche de Midjourney, avec une approche un peu plus simple.
D'autres applications sont apparues depuis et certaines paraissent à même de rivaliser avec les ténors du domaine, notamment leonardo.ai ou Adobe Firefly. Toutefois, l'accès à à ces applications nécessite de s'inscrire sur le site des éditeurs correspondants et d'attendre la réceptionréception d'une invitation, ce qui peut être fort long.
Donc, Stable Diffusion XL apparaît comme une bonne solution si l'on souhaite obtenir de belles réalisations artistiques sans avoir à devenir un expert du 'prompt'.
Nous allons aborder ici 4 façons de tirer le maximum de Stable Diffusion XL.
Ce qui est vrai pour l'un est vrai pour l'autre
En premier lieu, sachez une chose. Si vous savez formuler un prompt sur l'une des applications text-to-image, alors ce savoir-faire est transposable ailleurs.
- Ainsi, dans le tutorial Midjourney, nous voyons comment il est possible d'enrichir une image en indiquant des ombres et lumièreslumières, des palettes de couleurcouleur...
- Dans le tutorial Dall.e 2, nous vous encourageons à indiquer des stylesstyles : art deco, gravuregravure, vectoriel...
Tous ces conseils sont applicables à Stable Diffusion XL et d'ailleurs aussi, à n'importe quel text-to-image.
Prompt de base
Le point essentiel, est qu'il est possible d'obtenir une image de qualité sous Stable Diffusion XL, avec un prompt relativement simple. Ainsi, depuis dreamstudio.ai, nous avons simplement tapé une requête ultra simple : "the most beautiful woman" (l'application traite des prompts en anglais). Cliquez sous "Styles" et sélectionnez l'un de ceux que vous propose Stable Diffusion. Tout en bas de l'écran sur la gauche, vérifiez bien que vous avez choisi : SDXL Beta Preview. Cliquez ensuite sur Dream. 4 images sont alors générés sur la partie droite. C'est aussi simple que cela, et le résultat devrait être de qualité.
Si l'une des images vous plaît, vous pouvez cliquer dessus pour l'agrandir et Générer des variations (la 1ère option). Dès lors qu'une image vous convient, choisissez Download (l'option sur la droite). Sous Upscale (agrandissement), choisissez x2 afin de doubler la définition de l'image.
Lexica.art
Une autre façon d'obtenir une image de belle galerie consiste à se rendre sur la galerie Lexica.art dédiée à Stable Diffusion. Des créateurs d'image y placent régulièrement leurs plus belles œuvres. Et vous pouvez en copier les prompts - quitte à les adapter à ce que vous recherchez.
Night Cafe
L'un des attraits de Stable Diffusion est ce que cette IA sert de 'moteur' pour de nombreuses applications : Night Café, Clipdrop, Replicate, Dreamlike.art... Assez souvent, l'accès est gratuit pour un nombre limité d'images. Si l'on souhaite plus de latitudelatitude, on peut souscrire à un abonnement, habituellement peu coûteux. Parfois aussi, l'application propose de gagner des crédits gratuits au fil des jours. Il existe plusieurs dizaines d'applications de ce genre. Nous apprécions Night Café en raison des modèles prédéfinis qu'il propose, mais vous pourrez préférer Clipdrop qui pour sa part, accepte des prompts en français.
Sous Night Café, veillez à bien sélectionner le modèle SDXL BETA. Indiquez un prompt même simple et choisissez l'un des nombreux modèles. Une fois qu'une image vous séduit, cliquez sur Enhance afin de l'agrandir. Il ne reste plus qu'à la télécharger.
Depuis une photo
Autre option, vous pouvez depuis Stable Diffusion XL charger une de vos photos. (Upload image). Indiquez ensuite un prompt - vous pouvez cliquer sur le bouton Shuffle prompt sur la droite - Stable Diffusion vous propose alors divers prompts. Il est important d'influer sur le paramètre Image strength - plus le pourcentage est élevé et plus l'image finale sera proche de l'original. Un pourcentage situé entre 50 et 72 % semble souvent adéquat.