L’imageur AI Midjourney v5 étourdit avec des images photoréalistes et des mains à 5 doigts

Agrandir / Un exemple d’effets d’éclairage et de peau dans le générateur d’images AI Midjourney v5.

Mercredi, Midjourney a annoncé la version 5 de son service commercial de synthèse d’images d’IA, qui peut produire des images photoréalistes à un niveau de qualité que certains fans d’art de l’IA qualifient d’effrayant et de “trop ​​​​parfait”. Midjourney v5 est désormais disponible en tant que test alpha pour les clients qui s’abonnent au service Midjourney, disponible via Discord.

“MJ v5 me donne actuellement l’impression d’avoir enfin des lunettes après avoir ignoré la mauvaise vue pendant un peu trop longtemps”, a déclaré Julie Wieland, une graphiste qui partage souvent ses créations Midjourney sur Twitter. “Soudain, vous voyez tout en 4k, c’est étrangement écrasant mais aussi incroyable.”

Wieland a partagé certaines de ses générations Midjourney v5 avec Ars Technica (voir ci-dessous dans une galerie et dans l’image principale ci-dessus), et elles montrent certainement une progression dans les détails de l’image depuis l’arrivée de Midjourney en mars 2022. La version 3 a fait ses débuts en août, et la version 4 a fait ses débuts en novembre. Chaque itération a ajouté plus de détails aux résultats générés, comme le montrent nos expériences :

Une comparaison entre la sortie de Midjourney v3 (à gauche), v4 (au centre) et v5 (à droite) avec l'invite Agrandir / Une comparaison entre la sortie de Midjourney v3 (à gauche), v4 (au centre) et v5 (à droite) avec l’invite “un barbare musclé avec des armes à côté d’un téléviseur CRT, cinématique, 8K, éclairage de studio”.

Ars Technica

Midjourney fonctionne de la même manière que les synthétiseurs d’images comme Stable Diffusion et DALL-E en ce sens qu’il génère des images basées sur des descriptions textuelles appelées “invites” à l’aide d’un modèle d’IA formé sur des millions d’œuvres d’art créées par l’homme. Récemment, Midjourney était au cœur d’une controverse sur le droit d’auteur concernant une bande dessinée qui utilisait des versions antérieures du service.

Publicité

  • Une “photographie synthétique” générée par l’IA d’une fille à travers une fenêtre générée à l’aide de Midjourney v5 par Julie Wieland.

    Julie Wieland

  • Une “photographie synthétique” générée par l’IA d’un cheeseburger générée à l’aide de Midjourney v5 par Julie Wieland.

    Julie Wieland

  • Une “photographie synthétique” générée par l’IA d’un garçon et de fleurs générée à l’aide de Midjourney v5 par Julie Wieland.

    Julie Wieland

  • Une “photographie synthétique” générée par l’IA d’un clown générée à l’aide de Midjourney v5 par Julie Wieland.

    Julie Wieland

  • Une “photographie synthétique” générée par l’IA d’une fille générée à l’aide de Midjourney v5 par Julie Wieland.

    Julie Wieland

  • Une version améliorée d’une sortie Midjourney v5 avec l’invite “un barbare musclé avec des armes à côté d’un téléviseur CRT, cinématique, 8K, éclairage de studio”.

Après avoir expérimenté la v5 pendant une journée, Wieland a noté des améliorations qui incluent des textures de peau et des traits du visage “incroyablement réalistes” ; éclairage plus réaliste ou cinématographique ; meilleurs reflets, reflets et ombres ; des angles plus expressifs ou des vues d’ensemble d’une scène, et “des yeux presque parfaits et plus bancaux”.

Et, bien sûr, les mains.

Juste un avertissement – L’IA de Midjourney peut maintenant faire les mains correctement. Soyez très critique à l’égard de toute imagerie politique (en particulier la photographie) que vous voyez en ligne et qui tente de susciter une réaction. pic.twitter.com/ebEagrQAQq

– Del Walker (@TheCartelDel) 16 mars 2023

Au cours de l’année écoulée, l’idée que les générateurs d’art IA ne peuvent pas rendre les mains correctement est devenue un trope culturel. Notamment, Midjourney v5 peut générer assez bien des mains humaines réalistes. “Les mains sont correctes la plupart du temps, avec 5 doigts au lieu de 7-10 sur une main”, a déclaré Wieland.

Dans les notes de publication Discord du service, Midjourney a également noté que la v5 répond désormais avec une “gamme stylistique beaucoup plus large” que la version 4, tout en étant plus sensible aux invites, en générant moins de texte indésirable et en offrant une résolution d’image multipliée par 2.

S’il y a un inconvénient visuel à la mise à niveau de Midjourney pour les fans d’art IA, cela vient peut-être d’images qui peuvent être si réalistes et “parfaites” que la précision du modèle enlève une partie du frisson de générer à plusieurs reprises des images IA pour trouver un résultat approprié, quoi on pourrait appeler un “effet de machine à sous”. Bien qu’un utilisateur de Twitter nommé Philipp Lenssen ait noté : “Si vous avez un sujet d’image spécifique en tête, c’est toujours un peu comme la loterie. Mais avec des chances de gagner plus élevées que la v4.”

commentaires

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Le plus populaire