Il est possible avec Stable Diffusion XL d'obtenir des images originales et de qualité de façon relativement peu complexe. Voici 4 façons de procéder…


au sommaire


    Dans l'universunivers des text-to-image (générateur d'images IA), trois applicationsapplications se disputent le leadership, celles apparues dès 2022 et parfois même un peu avant :

    • Midjourney est habituellement considérée comme la meilleure du lot. Sa prise en main n'est pas aisée. Nous lui avons consacré un tutorial sur cette page.
    • Dall.e 2 est le text-to-image de OpenAI, créateur de ChatGPT. Il est beaucoup moins avancé que Midjourney. Il a toutefois l'avantage d'être accessible depuis le moteur de recherche Bing, en tant que Bing Image Creator. De ce fait, un grand nombre d'utilisateurs découvrent les text-to-image via Dall.e 2. Là encore, nous avons publié un tutorial pour cette application.
    • Stable DiffusionDiffusion est l'œuvre de la société Stability.ai et il est accessible à l'adresse dreamstudio.ai. Or, depuis avril 2023, une nouvelle version est apparue, Stable Diffusion XL. Si l'on prend soin d'utiliser cette version exacte, on a alors affaire à un outil d'une qualité proche de Midjourney, avec une approche un peu plus simple.

    D'autres applications sont apparues depuis et certaines paraissent à même de rivaliser avec les ténors du domaine, notamment leonardo.ai ou Adobe Firefly. Toutefois, l'accès à à ces applications nécessite de s'inscrire sur le site des éditeurs correspondants et d'attendre la réceptionréception d'une invitation, ce qui peut être fort long.

    Donc, Stable Diffusion XL apparaît comme une bonne solution si l'on souhaite obtenir de belles réalisations artistiques sans avoir à devenir un expert du 'prompt'.

    Nous allons aborder ici 4 façons de tirer le maximum de Stable Diffusion XL.

    Ce qui est vrai pour l'un est vrai pour l'autre

    En premier lieu, sachez une chose. Si vous savez formuler un prompt sur l'une des applications text-to-image, alors ce savoir-faire est transposable ailleurs.

    Tous ces conseils sont applicables à Stable Diffusion XL et d'ailleurs aussi, à n'importe quel text-to-image.

    Prompt de base

    Le point essentiel, est qu'il est possible d'obtenir une image de qualité sous Stable Diffusion XL, avec un prompt  relativement simple. Ainsi, depuis dreamstudio.ai, nous avons simplement tapé une requête ultra simple : "the most beautiful woman" (l'application traite des prompts en anglais). Cliquez sous "Styles" et sélectionnez l'un de ceux que vous propose Stable Diffusion. Tout en bas de l'écran sur la gauche, vérifiez bien que vous avez choisi : SDXL Beta Preview. Cliquez ensuite sur Dream. 4 images sont alors générés sur la partie droite. C'est aussi simple que cela, et le résultat devrait être de qualité.

    Un prompt simple, auquel nous avons appliqué le style prédéfini Craft clay (argile artisanale). © Stability.ai
    Un prompt simple, auquel nous avons appliqué le style prédéfini Craft clay (argile artisanale). © Stability.ai

    Si l'une des images vous plaît, vous pouvez cliquer dessus pour l'agrandir et Générer des variations (la 1ère option). Dès lors qu'une image vous convient, choisissez Download (l'option sur la droite). Sous Upscale (agrandissement), choisissez x2 afin de doubler la définition de l'image.

    Un exemple d'image obtenue à partir d'un prompt simple. © Stability.ai
    Un exemple d'image obtenue à partir d'un prompt simple. © Stability.ai

    Lexica.art

    Une autre façon d'obtenir une image de belle galerie consiste à se rendre sur la galerie Lexica.art dédiée à Stable Diffusion. Des créateurs d'image y placent régulièrement leurs plus belles œuvres. Et vous pouvez en copier les prompts - quitte à les adapter à ce que vous recherchez.

    Sur la galerie Lexica.art on trouve pléthore d'images de qualité. © Lexica.art
    Sur la galerie Lexica.art on trouve pléthore d'images de qualité. © Lexica.art
    Une fois que nous repérons une image qui nous plaît, il est possible de copier son prompt. © Lexica.art
    Une fois que nous repérons une image qui nous plaît, il est possible de copier son prompt. © Lexica.art
    Le prompt a été copié dans Stable Diffusion et nous avons ajouté quelques détails supplémentaires. © Stability XL.
    Le prompt a été copié dans Stable Diffusion et nous avons ajouté quelques détails supplémentaires. © Stability XL.
    L'image choisie et agrandie. © Stability XL
    L'image choisie et agrandie. © Stability XL

     

    Night Cafe

    L'un des attraits de Stable Diffusion est ce que cette IA sert de 'moteur' pour de nombreuses applications : Night Café, Clipdrop, Replicate, Dreamlike.art... Assez souvent, l'accès est gratuit pour un nombre limité d'images. Si l'on souhaite plus de latitudelatitude, on peut souscrire à un abonnement, habituellement peu coûteux. Parfois aussi, l'application propose de gagner des crédits gratuits au fil des jours. Il existe plusieurs dizaines d'applications de ce genre. Nous apprécions Night Café en raison des modèles prédéfinis qu'il propose, mais vous pourrez préférer Clipdrop qui pour sa part, accepte des prompts en français.

    Sous Night Café, veillez à bien sélectionner le modèle SDXL BETA. Indiquez un prompt même simple et choisissez l'un des nombreux modèles. Une fois qu'une image vous séduit, cliquez sur Enhance afin de l'agrandir. Il ne reste plus qu'à la télécharger.

    Night Café nous guide dans le choix d'un style d'image, et nous pouvons donc partir d'un prompt simple. © NightCafé
    Night Café nous guide dans le choix d'un style d'image, et nous pouvons donc partir d'un prompt simple. © NightCafé
    Exemple d'image générée fort simplement avec Night Café. © NightCafé
    Exemple d'image générée fort simplement avec Night Café. © NightCafé
    Autre exemple d'image générée à partir d'un prompt simple et l'un des modèles de NightCafé. © NightCafé
    Autre exemple d'image générée à partir d'un prompt simple et l'un des modèles de NightCafé. © NightCafé

     

    Depuis une photo

    Autre option, vous pouvez depuis Stable Diffusion XL charger une de vos photos. (Upload image). Indiquez ensuite un prompt - vous pouvez cliquer sur le bouton Shuffle prompt sur la droite - Stable Diffusion vous propose alors divers prompts. Il est important d'influer sur le paramètre Image strength - plus le pourcentage est élevé et plus l'image finale sera proche de l'original. Un pourcentage situé entre 50 et 72 % semble souvent adéquat.

    Ici nous sommes partis d'une photographie. Le prompt a été suggéré par Stable Diffusion XL et le "poids" de l'image originale abaissé à 50 %. © Stability.ai
    Ici nous sommes partis d'une photographie. Le prompt a été suggéré par Stable Diffusion XL et le "poids" de l'image originale abaissé à 50 %. © Stability.ai
    L'une des images agrandie et téléchargée. © Stability.ai
    L'une des images agrandie et téléchargée. © Stability.ai