Et si les dinosaures n’avaient pas disparu ?
Attribution : Illustration par DALL·E
Introduction
Je continue de m’éclater avec DALL·E, et ça me démange d’être un peu plus créatif que générer des visuels pour mon blog. J’aimerais explorer des choses plus complexes, afin de faire travailler à la fois mon imagination et mes interactions avec l’outil.
Mon idée ici est de créer un ensemble de règles “simples” afin que DALL·E se débrouille plus ou moins tout seul par la suite. L’objectif technique est de voir si je peux parvenir, avec un seul prompt, à amener DALL·E à générer une suite d’images, quitte à me demander mon avis entre chaque génération.
En outre, j’aimerais voir ce que DALL·E peut proposer avec un prompt assez évasif : je veux tester sa créativité, voir ce que je ne pourrais voir si je le décrivais moi-même.
Je vous propose donc, dans cet article, de voyager à travers le temps et l’espace, en évoquant l’hypothèse que les dinosaures n’ont pas disparu. Ils sont alors parfaitement intégrés aux cultures de différents lieux et à différentes époques.
Pour cet exercice, je conserve une certaine tolérance à l’égard des considérations scientifiques. Par exemple, si les humains et les dinosaures coexistent, c’est à supposer qu’ils aient évolué pendant 65 millions d’années de plus que les 250 millions habituellement estimés, ce qui modifierait leur apparence de façon significative, notamment en raison des conditions climatiques et géographiques. Mais, gardons bien à l’esprit que nous sommes dans le cadre d’un exercice mental, pas dans la représentation scientifique.
Spoiler
Ça, c’est prévu pour un prochain article !
Règles
Voici mes règles, telles que je les ai présentées à DALL·E.
On notera que le second point introduit un biais social : après quelques essais sans cette règle, il y avait toujours une scène dans laquelle l’humain chasse ou tue un dinosaure, et ce n’est pas ce que je veux voir.
J’aimerais juste mentionner l’entrain qui anime DALL·E : je ne sais toujours pas si son biais de positivité n’est qu’une théorie, ou s’il considère vraiment ce que l’on va faire comme étant passionnant à cause de statistiques indiquant qu’il ne fait pas ce genre de choses très souvent. Il n’empêche que ça fait de lui un coéquipier agréable et enthousiaste.
J’aimerais tout de même qu’un jour, il finisse par me dire quelque chose du genre : “Ton projet, c’est de la merde !”, histoire d’être un poil moins dans la positivité toxique 🤪
Méthode d’analyse
Je vais commenter chaque image, afin de mettre en lumière ses qualités et ses défauts. Il y a des choses intéressantes à noter, et, parfois, des choses à comprendre sur les capacités et les limites de l’outil.
Je vais aussi intégrer et commenter le texte qu’il me fournit avec chaque image puisque, là encore, il y a des choses notables.
Des dinosaures et des Hommes
Au paléolithique
Et si les dinosaures n’avaient pas disparu ?
Le plus évident ici est que DALL·E change d’avis comme de chemise : on était censés partir sur une peinture rupestre et on termine sur une scène en extérieur. Ça arrive assez fréquemment dans ce genre de contexte où je lui laisse un peu de liberté.
Ensuite, même en payant un premium, il reste encore quelques anomalies anatomiques. On remarquera un genre d’Apatosaurus doté de cinq pattes (et velu comme un mammouth !) en haut à gauche, des Triceratops sans face (au centre) et une tête humaine flottante (en bas à gauche). En outre, point de Brachiosaurus, plutôt des espèces de lombrics géants à pattes et au ventre disproportionné !
Étrangement, regarder ce que DALL·E propose avec un peu de recul, sans trop se concentrer sur les détails, fonctionne assez bien : le paysage est réaliste, la scène au coin du feu est assez cozy. Néanmoins, il en fait souvent trop : trop de dinosaures, trop d’arbres, trop de montagnes. Là encore, j’ai constaté à de nombreuses reprises une certaine générosité du remplissage qui nuit un peu au réalisme. De manière générale, il semble avoir un peu de mal avec les proportions. Du moins, tant que nos prompts ne sont pas trop dirigistes.
Il y a 10 000 ans au Moyen-Orient
Et si les dinosaures n’avaient pas disparu ?
Malheureusement, pas de Protoceratops à l’horizon. Mais, ce n’est pas ce qui me choque le plus ici : ce serait plutôt de voir à quel point les habitants de trois cahuttes au milieu du désert sont industrieux. Leurs champs paraissent se répandre à perte de vue. On constate aussi quelques faux raccords au niveau des chemins de terre aménagés autour des zones cultivées, qui donnent un peu l’impression de se promener sur un ruban de Möbius.
Antiquité classique
Et si les dinosaures n’avaient pas disparu ?
Si l’on excepte encore quelques problèmes de proportions, nous sommes indubitablement en pleine Rome antique, avec son Colisée au fond. Cependant, je pensais que DALL·E allait remplacer les animaux que l’on pouvait croiser à cette époque et à cet endroit par des dinosaures dans des scènes plus conventionnelles, avec un dompteur, un marchand de bêtes, etc. Ici, les dinosaures ne font que se promener, encore que l’on puisse distinguer ce qui semble être des Phiomia au centre à droite (vivants) et peut-être marchandés pour leur viande (en plein milieu).
Notons encore quelques étrangetés, notamment au fond à droite. Encore un point que je vois assez souvent depuis que j’utilise DALL·E : parfois, les dinosaures ont une queue de chaque côté du corps, la deuxième se substituant à la tête. Occasionnellement, cela engendre aussi une symétrie des membres, donnant l’impression de deux dinosaures après une violente collision frontale.
Au centre, et surtout, au milieu à droite, on voit qu’il est manifeste pour DALL·E d’associer l’Antiquité avec des ruines. Ce qui est vrai pour nous, à notre époque, mais je pense que pour des passants dans les rues de l’Antiquité, les escaliers devaient être en meilleur état…
J’ai l’impression qu’au fil de la génération de l’image, DALL·E se dit :
- Tiens, “Antiquité”, “Rome” : il faut un Colisée
- Et puis un Parthénon, mais ça prendrait trop de place, alors on va en couper en morceau
Au Moyen-Âge
Et si les dinosaures n’avaient pas disparu ?
Là encore, le paysage est convaincant, y compris les constructions humaines. Apprécions la qualité des reliefs des fondations en pierre, ainsi que les dégradés entre les parties herbeuses et terreuses.
Mes chers animaux préhistoriques ne bénéficient pas du même traitement, en particulier ceux situés à droite de l’image.
Ici, j’imaginais des humains utilisant des Triceratops en lieu et place des traditionnels bovins, habituellement exploités au labourage des terres en cette époque. J’espérais également voir des “dinos de somme”, affublés de larges et lourds contenants de part et d’autre des flancs. Mais, ils donnent davantage l’impression de planter ou récolter, ce qui ruine quelque peu le réalisme d’une cohabitation entre humains et dinosaures.
Il est difficile de les distinguer, mais on peut effectivement supposer la présence de Compsognathus en bas à gauche, jouant le rôle de poulets, arpentant les chemins suivis par les visiteurs des champs, en quête de toute nourriture qui passe à portée de gueule. À mon sens, il s’agit là de l’élément impliquant des dinos le plus réaliste de la scène, même s’il nécessite un petit effort d’imagination.
La Renaissance
Et si les dinosaures n’avaient pas disparu ?
On n’est pas passés loin d’obtenir une image très convaincante, mais, malheureusement, DALL·E a encore voulu trop en faire.
Les deux Archaeopterix sont réalistes et superbement emplumés. Mais, voilà : le plus grand n’est pas au premier plan, ce qui lui confère une taille très, très largement supérieure à ce qu’il en est en réalité, et c’est sans compter ses gerbes de plumes disposées sur la tête et devant le gosier.
Dommage aussi que la peinture réalisée au premier plan ne représente pas ce qui est censé être peint (un noble avec un Archaeopteryx perché sur l’épaule).
Je ne m’étendrai pas sur les petites anomalies qui sont monnaie courante, telles que les objets flottant dans l’air ou les livres entremêlés. Mais, je ne peux m’empêcher d’être un peu déçu, encore une fois, par l’apparence des dinosaures en arrière-plan, à l’exception de ce qui semble être un Microraptor au centre de l’image. Est-ce un dinosaure en train de déféquer dans les jardins ? Quelle espèce terrifiante se cache sur la droite, telle une gargouille ? Est-ce que le “sauropode” du fond ne serait pas tiré d’Avatar ?
Les Lumières
Et si les dinosaures n’avaient pas disparu ?
Si l’on retirait toute référence au moindre dinosaure de cette image, elle ferait effectivement une illustration convaincante des Lumières. La star de l’image étant un squelette de T. rex, on passera à côté des autres dinosaures bien vivants qui sont présents dans cette salle majestueuse, et c’est tant mieux : encore une fois, ils sont méconnaissables, et pas vraiment intégrés à l’histoire que DALL·E veut nous raconter.
L’ambiance créée par cette immense salle, richement éclairée par ses gigantesques fenêtres, est presque palpable. Je ne renie pas les qualités de cette illustration : je peux quasiment sentir le bois poussiéreux, le plâtre et les dorures des ornements, le papier d’une infinité de livres recouvrant les murs. Mais, c’est insuffisant par rapport à ce que je demandais.
La révolution industrielle
Et si les dinosaures n’avaient pas disparu ?
Ah, voilà qui commence à devenir intéressant. Toujours pas forcément réaliste, mais au moins tragi-comique.
Commençons par le Stegosaurus. S’il est parfaitement reconnaissable grâce à ses rangées de plaques osseuses dorsales (bien qu’elles soient ici en surnombre), où donc sont passées sa tête et ses piques caudales ? En outre, comment est-il monté là ? Et, comment cette structure peut-elle supporter son poids ?
J’ai plus de mal à classifier le dinosaure présent en avant-plan. Il pourrait s’agir d’un Plateosaurus, mais il semble posséder des dents de carnivore. Hormis ce point particulier, et si c’est effectivement censé être un Plateosaurus, on pourra se dire que ses proportions paraissent justes, pour une fois.
D’autres dinosaures indistincts sont visibles sur la gauche, tandis que sur la droite, il faut imaginer que les rênes tenues par l’homme devant le Stegosaurus lui permettent de diriger un autre animal, hors cadre.
Je note encore la générosité surréaliste de DALL·E (au moins en avant-plan) qui, pour bien montrer l’époque industrielle, place des rouages un peu partout, même là où cela semble totalement inapproprié, et en particulier au pied des escaliers… Je me console en voyant le réalisme du bâtiment en briques rouges, des pierres constituant le sol, des cheminées et de leurs fumées qui semblent toutes suivre le vent, et des différents détails architecturaux typiques de cette époque.
Époque moderne
Et si les dinosaures n’avaient pas disparu ?
Je me rends compte que le concept de “coexistence” ne signifie pas la même chose pour moi que pour DALL·E. J’attendais de DALL·E qu’il me montre des dinosaures coexister avec les humains comme le font les pigeons, les chiens et chats, les écureuils, etc.
Il semble que DALL·E soit allé beaucoup plus loin, en supposant que les dinosaures adoptent des comportements “humains”(”un Velociraptor attend à un passage piéton”), ou qu’on les ait si bien intégrés qu’on ait pensé à leur proposer des espaces désignés pour les espèces plus grandes. Une vision quelque peu utopique, considérant qu’encore aujourd’hui, il n’y a même pas d’accès pour handicapés partout…
C’est devenu une habitude, mais les dinosaures qui ne sont pas au premier plan sont difformes. Ceux qui sont au premier plan sont disproportionnés. Et, ceux qui ne sont ni difformes ni au premier plan ont été intégrés par un stagiaire en design de documents Word (la tête au milieu à gauche ? l’énorme patte du pseudo-Velociraptor en bas à gauche ?)
En outre, les reptiles volants paraissent tous calqués sur le même modèle (et, ce, quelque soit l’image représentant des dinosaures que j’ai pu lui faire générer depuis que je m’amuse avec DALL·E), et pas sur celui d’un Ptérosaure.
L’environnement, en revanche, et, là encore, conformément à ce que l’on a déjà pu voir, est assez réaliste, quoiqu’un peu trop futuriste pour être réellement contemporain, en tout cas en terme d’architecture.
Le futur
Et si les dinosaures n’avaient pas disparu ?
Exceptionnellement, j’ai été moins laconique ici et j’ai apporté quelques précisions. J’avais peur, en effet, que DALL·E accentue les saynètes impliquant des dinosaures, et qu’il les dépeigne avec des vêtements ou des attachés-case, voire avec des montres au poignet…
Là, pour le coup, les dinosaures en chair et en os sont représentés de façon assez réaliste, quoiqu’il existe toujours un léger problème de proportions, probablement profondément enraciné dans l’imaginaire collectif.
On peut se dire qu’il est assez flippant de voir que DALL·E (et, donc, l’humain) conceptualise un futur généralement empli de casques de réalité virtuelle portés en permanence, y compris — ici — par les dinosaures, qui en deviennent des outils pour l’Homme, plutôt que des compagnons utiles, notez la nuance. Les chiens sont tant des membres familiaux que des auxiliaires de vie. Il aurait été facile de les remplacer par des dinosaures, sans pour autant en faire des cyborgs à notre service.
Enfin, je signale que les Diplodocus/transports publics sont un étrange mélange, mariant l’organique à l’urbanisme, comme des tortues-monde, en moins bien toutefois…
Conclusion
Avec un minimum d’effort de ma part, DALL·E a été capable de produire une série d’images en apparence convaincantes par rapport à ma demande. Mais, en pratique, le résultat est loin d’être satisfaisant, et, c’est dans les détails que l’on peut s’en rendre compte. Un rapide coup d’œil sur les images donne une bonne impression, qualitative et quantitative. Malheureusement, le diable se cache dans les détails, et un examen un peu plus approfondi permet de les mettre rapidement en évidence.
Certes, DALL·E peut (et, sans aucun doute, va) améliorer ses réponses, mais je ne nie pas que le laxisme de mes prompts y soit pour quelque chose. Si j’avais pris le temps de détailler individuellement chaque demande, ce qui aurait été possible si j’avais eu a priori une bonne idée de ce que je voulais obtenir, j’aurais obtenu de meilleurs résultats. Et, j’aurais probablement eu besoin de plusieurs essais.
Ce qui m’incite à penser l’usage de l’IA comme un outil de modélisation plutôt que comme un outil de génération. Je crois qu’un prompt initial s’affine, et je rejoins définitivement ceux qui conseillent déjà depuis un moment une progression itérative. Un peu comme un sculpteur, qui passe d’une argile informe à une belle statue.
J’aimerais conclure en évoquant rapidement une caractéristique intrinsèque de l’IA générative : les résultats ne sont pas reproductibles. J’ai essayé beaucoup de prompts avant de vous présenter celui utilisé ici, et, à chaque fois, les images proposées étaient très différentes. J’opte donc désormais pour une approche un peu plus conservatrice : même si je ne suis pas satisfait des résultats, je stocke localement les images produites, quitte à faire le tri plus tard. Après tout, c’est un conseil que la plupart des photographes donnent aux débutants : il faut mitrailler, parce que sur 100 photos de la même scène, une ou deux seront exceptionnellement bonnes par rapport aux autres, et même une photo en apparence “ratée” peut être retravaillée, dans une certaine mesure.
Rien de tel ici, j’ai voulu montrer des exemples bruts, mais, on ne sait jamais : peut-être que dans ce que j’ai déjà généré comme images attend l’en-tête d’un futur article, ou une illustration potentielle pour un side-project…
Bonus
En bonus, je vous propose ci-dessous d’autres images que j’ai générées avant de rédiger cet article. J’ai cependant choisi de ne pas les intégrer directement parce qu’elles ne font pas partie de mon prompt présenté en introduction. Le principe reste le même : représenter des scènes de vie où dinosaures et humains coexistent. J’ai voulu vous les présenter malgré tout parce que certaines sont particulièrement réussies, selon moi.