Le dernier article du web écrit à la main

Après une phase de méfiance vis-à-vis de l'IA et de ce qu'elle avait à offrir, encouragé par la communauté de Age Of Olympia, je me suis décidé à utiliser les outils de création artistique de l'IA disponibles sur la toile. Évidemment, je suis immédiatement devenu accro. Au point de m'offrir un abonnement aux deux grosses plateformes d'IA que sont OpenAI et Midjourney. Je vous fais un petit retour sur l'utilisation que j'en ai faite et mes premières impressions.

Screenshot%202024-03-18%20at%2010-59-09%20My%20Images

Les prix et l'interface

J'ai comparé les trois plateformes d'IA suivantes: Bing copilot/designer (Microsoft), chatGPT/Dall-e (Open AI) et Midjourney.

Bing Designer

Screenshot%202024-03-18%20at%2010-35-57%20Photography%20deep%20focus.%20Un%20l%C3%A9gionnaire%20romain%20en%20train%20de%20lire%20un%20magazine%20de%20jeux-vid%C3%A9os%20assis%20sur%20les%20ruines%20de%20sa%20cit%C3%A9.%20-%20Bing

Bing est gratuit, mais on dispose de 15 générations rapides (15sec environ) par jour. Au-delà de 15, les générations sont plus lentes (entre 30sec et 1min en fonction de l'affluence). Il existe une limitation du nombre de génération total par jour (mais le seuil est assez élevé). L'interface est facile à aborder, il suffit d'entrer le prompt dans l'unique champ disponible (en anglais ou en français). On obtient en général 4 images.

La liste des prompts générés est toutefois lourde d'accès, et il était impossible de retrouver les générations les plus anciennes (mieux vaut sauvegarder sur le disque les images que vous souhaitez conserver).

OpenAI

Screenshot%202024-03-18%20at%2010-37-12%20ChatGPT%20-%20image%20generator

OpenAI propose un accès gratuit à chatGPT (en version 3.5). Toutefois, pour générer des images, il faudra disposer de chatGPT version 4 et pour cela débourser la somme de 20$/mois.

Le grand avantage de cette souscription est l'accès à tous les GPT d'openAI: chatGPT est vraiment très performant, il est très agréable de converser (en français) avec elle en mode "text2speech" (ce que je fais quand je suis coincé dans les embouteillages).

Les utilisations de chatGPT sont très vastes: par exemple, je lui ai fourni un dictionnaire Sildarin-Français afin qu'il m'aide à concevoir des noms de lieux et de personnages en Elfiques. L'interface est claire et réactive. La création d'image se fait par prompt, mais aussi en demandant directement à chatGPT d'apporter des modifications. Ce mode "assistant" est vraiment très pratique.

On peut aussi lui donner une image et lui demander d'en retirer un prompt afin de générer une image à partir de celle-ci. Le nombre de génération d'image est limité (mais il faut vraiment spammer pour l'atteindre). Ici encore, mieux vaut sauvegarder les images qui nous ont plu sur le disque dur, car elles s'effacent au bout d'un mois.

Midjourney

Screenshot%202024-03-18%20at%2010-40-17%20Discord%20-%20A%20New%20Way%20to%20Chat%20with%20Friends%20&%20Communities

Midjourney est payant: la première offre est à 8$ par mois, mais pour le test j'ai souscrit à l'offre à 25$ afin d'être dans la même fourchette de prix que le plan d'OpenAI.

L'interface est assez déroutante: la plupart des interactions avec l'IA se déroulent via le chat Discord. Rien n'est instinctif, il faut absolument suivre des tutos pour comprendre comment procéder. On ne peut pas "dialoguer" avec le bot de Midjourney comme on le ferait avec l'assistant d'OpenAI. Les paramètres, nombreux, se règlent en ligne de commande.

La vitesse de génération est à peu près la même que celle de chatGPT (environ 30sec) pour 4 images à chaque fois. Il faudra ensuite "upscaler" l'une des 4 images pour la travailler ou la sauvegarder (cela se fait très vite). Point positif concernant l'interface, en allant sur le site de Midjourney, on retrouve l'ensemble de nos images upscalées avec leurs prompts, dans une galerie très bien faite et rapide d'accès.

Pourquoi tu veux générer une femme, sale pervers?

Ma principale déception concernant OpenAI a été son algorithme de censure. Parfois, pour une raison que lui-même n'arrive pas à expliquer, l'image ne peut être générée. En général, cela concerne les personnages de sexe féminins, peu importe leur pose ou ce qu'elles portent. C'est très frustrant.

Bing est un peu moins embêtant sur ce côté: lui s'attache surtout à censurer le gore et les mauvaises vibes, mais ses restrictions sont facilement contournables).

Midjourney, à mon sens, offre des restrictions plus raisonnables et surtout, vous dira tout de suite pourquoi il n'a pas pu générer l'image.

Résultat et précision

dezoom

Les résultats de Bing sont assez peu précis, mais en général assez cohérents et beaux.

Ceux d'OpenAI un peu plus précis, mais parfois l'IA oublie des termes du prompt et il faut donc lui rappeler ces termes, ce qui nécessite souvent de régénérer plusieurs fois l'image.

Midjourney est très précis, pour peu que l'on réussisse à forger un prompt correct, en utilisant les bons paramètres. On peut sélectionner une région de l'image à changer. On peut changer juste le décor en gardant les sujets à l'identique. On peut dézoomer l'image autant que l'on veut sans toucher aux personnages (voir image ci-dessus). On peut lui dire de s'inspirer d'une image en lui donnant le lien. Peu loquace, le bot de Midjourney se révèle à la longue d'une efficacité redoutable.

Bande dessinée

bd_exemple

Concernant la création de planches de BD, seul OpenAI a rendu des résultats satisfaisant. Probablement parce que les prompts de ce genre de génération sont en général assez longs, et que l'on peut lui dire quoi faire case par case dans un même prompt. Par exemple:

Une bande dessinée de type Comics, avec 4 ou 5 cases:

Case 1: ...

Case 2: ...

etc...

La plus jolie écriture

Bing et OpenAI sont des tanches pour écrire des phrases ou ne serait-ce qu'un mot, au point de gâcher totalement un rendu avec des inscriptions illisibles ou barbares. Midjourney est un peu plus performant.

Le plus consistent

consistent_thetis

La création de personnages "consistents" est une option très recherchée. Elle permet de reprendre un même personnage à l'identique, afin de changer son expression faciale ou simplement de changer son décor. Il est très difficile d'obtenir un résultat satisfaisant. Avec Bing, cela est presque impossible.

Avec OpenAI, on peut nommer un personnage afin que l'IA réutilise le prompt associé pour créer une nouvelle posture ou une nouvelle scène. Mais malgré cela, et malgré le fait d'ajouter le "seed" de l'image initiale, il reste difficile de créer plusieurs versions identiques du même personnage (il faut suivre de nombreux tutos pour cela).

Midjourney est également assez résistant à ce genre de prodige. Il me faudra certainement travailler plus et lire plus de doc pour arriver à mes fins.

Conclusion

Bing a l'avantage d'être gratuit, facile et plutôt rapide: je l'utilise toujours, lorsque je souhaite générer une image peu précise, en laissant l'IA m'étonner.

Utiliser OpenAI est très agréable, car on converse avec l'IA comme avec un assistant. Toutefois, les résultats sont un peu moins précis qu'avec Midjourney, et l'IA comprend vite, mais il faut lui expliquer longtemps.

Midjourney est difficile à prendre en main, mais permet, avec de gros efforts, d'arriver à des résultats précis et très réussis.

Concernant la censure, j'ai trouvé OpenAI très embêtant, Bing moyennement embêtant, et Midjourney peu embêtant.

Au final, pour la création d'images pures, ma préférence va à Midjourney. Si l'on a pas l'utilisation des autres outils d'OpenAI, un compte gratuit permettra l'accès à chatGPT 3.5, qui pourra nous aider à créer des prompts pour Midjourney.

Utiliser ces trois outils s'est révélé une expérience palpitante: l'IA est déjà très performante et promet de s'améliorer très rapidement.

Article précédent Article suivant