Le Quick Récap des Annonces Clés de la rentrée en IA Générative : focus text to image

1 octobre 2023

sa_whats-new-screen_v4-2-0_image_to_material

A l’occasion du lancement de ce portail par Numeum, le HUB Institute vous propose un récapitulatif complet des annonces et des innovations majeures dans le domaine de l'IA générative au cours des dernières semaines. Continuons notre panorama des actualités avec cette fois un focus sur l’une des révolutions qu’a apporté l’IA Générative : la révolution visuelle, dite Text to Image.

La Révolution Visuelle de l'IA : Text to Image

L'IA a accompli une prouesse remarquable en créant déjà autant d'images en quelques années qu'il a fallu aux photographes plus d'un siècle pour atteindre ce chiffre impressionnant. Depuis l'année dernière, plus de 15 milliards d'images ont été générées en utilisant des algorithmes de conversion de texte en image. Pour mettre cela en perspective, cela a nécessité 150 ans aux photographes, de la première photographie en 1826 jusqu'en 1975, pour atteindre le même nombre d'images. Cette avancée vertigineuse ouvre de nouvelles perspectives dans la création visuelle assistée par l'IA.

Croissance Phénoménale depuis DALLE-2

Depuis le lancement de DALLE-2, la production d'images assistée par l'IA connaît une croissance exponentielle. En moyenne, les utilisateurs génèrent désormais 34 millions d'images par jour, démontrant l'appétit insatiable pour cette technologie. Parmi les produits qui se démarquent, Adobe Firefly, intégré dans Adobe Photoshop, a atteint la stupéfiante barre du milliard d'images créées en seulement trois mois depuis son lancement. Midjourney compte déjà 15 millions d'utilisateurs. Au total, plus de 15 milliards d'images ont été générées grâce à des technologies telles que Stable Diffusion, Adobe Firefly, Midjourney et DALLE-2, dépassant même la bibliothèque de Shutterstock en termes de volume.

L’émergence de Dall-e 3

Une annonce récente pourrait bouleverser le classement : ChatGPT, avec son impressionnante portée de 100 millions d'utilisateurs, se profile comme un sérieux concurrent pour Midjourney, qui en compte actuellement 15,4 millions. L'accessibilité de Dall-e 3 semble simplifiée, car elle ne nécessiterait plus de maîtriser des instructions complexes pour créer des images. Une simple description en langage naturel suffirait.

Canva s’associe à ChatGPT

canva-x-chatgpt

De son côté, Canva a développé un plugin permettant de générer des créations directement depuis ChatGPT. Cette collaboration vise à rendre la création visuelle plus accessible et efficace pour un large public.

Les Annonces d'Adobe Firefly

Adobe a également marqué son territoire avec des annonces majeures. Adobe Firefly est désormais disponible par défaut dans Photoshop, mais aussi dans Illustrator et Adobe Express. Cette solution simplifie considérablement la création de contenu visuel, avec la possibilité d'utiliser des instructions dans plus de 100 langues.

Adobe s'engage à maintenir la confiance de ses utilisateurs en s'appuyant sur des contenus dont il détient les droits, tels qu'Adobe Stock Photo, ou sur des contenus tombés dans le domaine public. Cette stratégie vise à éviter les litiges liés aux droits d'auteur, une préoccupation majeure pour des concurrents comme Midjourney. Adobe renforce encore la transparence en introduisant des informations de traçabilité, appelées Content Credentials, pour signaler l'utilisation de l'IA générative, apportant ainsi une couche de confiance supplémentaire à son contenu.

Les innovations à suivre

  • Adobe Substance 3D Sampler 4.2 introduit une nouvelle version de Image to Material alimentée par l'IA pour créer des textures 3D, ainsi qu'une nouvelle fonctionnalité de mise à l'échelle et hausse de la résolution par l'IA.
  • Würstchen fait son entrée avec un modèle texte-vers-image rapide, capable de générer des images de haute résolution tout en consommant moins de puissance de calcul. Cette efficacité pourrait révolutionner la production d'images assistée par l'IA.
  • Aftershoot propose une IA dédiée à la retouche d'images sur des logiciels tels que Capture One et Lightroom, offrant ainsi une solution pratique pour les amateurs de photographie.
  • Ideogram.AI, bien que moins puissant que Midjourney, excelle dans la création d'images accompagnées de texte, idéal pour la création d'affiches ou d'œuvres graphiques.
  • Wunderman Thompson innove avec Brand Guardian, une IA qui automatise la revue et la qualité des contenus marketing, offrant ainsi un outil précieux pour les professionnels du marketing.

La révolution visuelle de l'IA générative ne montre aucun signe de ralentissement, ouvrant de nouvelles possibilités dans la création visuelle et la production de contenu de manière plus efficace que jamais. Les entreprises et les utilisateurs peuvent s'attendre à de nouvelles avancées qui transformeront encore davantage le paysage visuel de demain.

Retrouvez le BIG RECAP des actualités de l’IA Générative chaque semaine grâce à la HUBRADAR. Abonnez-vous

Le HUB Institute et Emmanuel Vivier

Retour aux articles