Agrandir / Variations de “une photo d’un chiot corgi heureux avec des lunettes de soleil fantaisie assises et tournées vers l’avant, lumière de studio, longshot” générées par DALL-E d’OpenAI.
OpenAI
Jeudi, OpenAI a annoncé l’introduction d’une API pour son modèle de synthèse d’images DALL-E qui permettra aux développeurs d’intégrer facilement sa technologie de génération d’images AI dans leurs applications. DALL-E, actuellement disponible en tant que service commercial autonome, permet aux utilisateurs de générer de nouvelles images 1024×1024 à partir de descriptions textuelles appelées “invites”. Les images générées peuvent varier en style, du photoréaliste à l’abstrait, et de nombreux styles entre les deux.
La nouvelle API d’OpenAI permet aux développeurs de logiciels d’introduire une invite d’image et d’autres paramètres dans le moteur DALL-E d’OpenAI via Internet. OpenAI génère ensuite l’image sur ses serveurs et renvoie l’image pour l’afficher dans l’application demandeuse. (Une API est une interface de programmation qui permet à différents programmes de communiquer entre eux.)
L’utilisation de l’API nécessite un enregistrement auprès d’OpenAI et une clé API privée permettant l’accès au générateur DALL-E. De plus, OpenAI prélève des frais pour chaque image générée en fonction de la résolution de l’image. Les images de 1024×1024 coûtent 0,02 USD par image, les images de 512×512 coûtent 0,018 USD par image et les images de 256×256 coûtent 0,016 USD par image.
Publicité
Agrandir / Un exemple DALL-E d'”un astronaute à cheval”.
OpenAI
Actuellement, Microsoft utilise déjà l’API DALL-E dans des essais à accès fermé de sa nouvelle application Microsoft Designer, et Shutterstock a récemment annoncé l’intégration de DALL-E dans son site Web. De plus, OpenAI indique que les applications de conception appelées CALA et Mixtiles utilisent également l’API DALL-E.
Depuis son lancement en avril, DALL-E et d’autres modèles de synthèse d’images, tels que Stable Diffusion, ont fait l’objet de controverses éthiques en raison de biais intégrés, de la capacité de générer potentiellement des images nuisibles et du fait que ces modèles génératifs d’IA ont été formés à l’aide d’œuvres d’art créées par l’homme sans le consentement de l’artiste individuel. Cependant, OpenAI implémente des filtres qui restreignent la génération de nudité, de “symboles de haine” et de violence dans le but de maintenir le service acceptable pour un public de masse.
Il convient de noter que Stable Diffusion est disponible en open source depuis août et que les développeurs ont déjà intégré cette technologie dans leurs applications sans les coûts de génération d’images individuelles, les filtres ou les restrictions de politique de contenu qui accompagnent l’API DALL-E d’OpenAI si elle est exécutée. localement. Cependant, Stability AI propose également sa propre API DreamStudio moyennant des frais qui accompagnent ses propres outils de modération de contenu.
Alors que la concurrence entre les modèles de synthèse d’images IA continue de s’intensifier, les développeurs ont désormais plus de choix sur le modèle qu’ils peuvent intégrer dans leurs produits.