Le Quick Récap des Annonces Clés de la rentrée en IA Générative : focus audio et video

10 octobre 2023

maxresdefault

A l’occasion du lancement de ce portail par Numeum, le HUB Institute vous propose un récapitulatif complet des annonces et des innovations majeures dans le domaine de l'IA générative au cours des dernières semaines. L’IA Générative n’en finit pas de repousser les frontières de la créativité visuelle et audiovisuelle. Text to Audio, Text to Video… quelles innovations les IA Génératives permettent-elles ?

L'IA Générative Text to Audio : L'évolution continue

L'IA générative Text to Audio franchit une nouvelle étape cette semaine, révolutionnant la manière dont nous interagissons avec le son et la voix. Imaginez une IA capable de traduire une vidéo en une autre langue en utilisant votre propre voix, et de synchroniser parfaitement le mouvement de vos lèvres pour correspondre à la nouvelle langue. Cette prouesse a été réalisée par Heygen.com, une avancée impressionnante qui repousse les limites de la création audiovisuelle assistée par l'IA.

Les exemples de l'IA générative bouleversant les industries créatives se multiplient. On se souvient notamment de la fausse collaboration entre Drake et The Weeknd, intitulée "Heart on my sleeve", qui a été refusée par les Grammy Awards. Cette technologie offre de nouvelles perspectives, tout en soulevant des questions sur l'authenticité et l'originalité dans la création artistique.

Les innovations à suivre : 

  • Les deepfakes deviennent de plus en plus accessibles, rapides à générer et impressionnants. Une parodie récente, mettant en scène Squeezie en mode Macron, en est un exemple frappant. Cette technologie permet de créer des vidéos truquées avec un réalisme étonnant, soulevant des questions sur la véracité des contenus audiovisuels.
  • L'IA générative s'étend également à l'industrie musicale. Une fausse chanson attribuée à Angèle et entièrement produite par une IA a accumulé plus de 3,3 millions de vues sur YouTube. L'artiste a même repris la fausse chanson sur son TikTok, générant ainsi 4 millions de vues supplémentaires. Cette tendance montre comment l'IA peut influencer la création artistique et défier les conventions.

L'IA générative Text to Audio continue de repousser les frontières de la créativité audiovisuelle, ouvrant de nouvelles opportunités et défis passionnants pour les artistes et les créateurs de contenu. Alors que cette technologie se démocratise, son impact sur nos expériences auditives et visuelles ne fait que commencer à se révéler.

Text to Video : Révolution dans le Monde de la Création Vidéo

Le secteur de la vidéo en ligne voit enfin l'intégration de l'IA grâce à des initiatives telles que l'application gratuite de montage YouTube Create, des aperçus IA personnalisés et des outils basés sur l'IA dans YouTube Studio. Parmi les nouvelles fonctionnalités, on trouve le doublage automatique avec Aloud, la recherche de musique assistée, la création de structures de vidéos, et bien plus encore. Ces innovations révolutionnent la manière dont les créateurs

Youtube is going all in on AI

produisent et partagent du contenu vidéo.  

Les puissantes nouveautés d'Adobe

Au salon IBC 2023, Adobe a dévoilé d'incroyables fonctionnalités basées sur l'IA qui révolutionnent le montage vidéo. Parmi celles-ci, on trouve :

Enhance Speech pour un nettoyage rapide des dialogues et une amélioration du mapping automatique des tons, garantissant une qualité sonore uniforme et Text-Based Editing pour la détection et la suppression des mots de remplissage tels que les "euh" et les "hum" dans les dialogues, facilitant ainsi le montage et la production vidéo.

Ces avancées transforment radicalement la création vidéo en simplifiant les tâches chronophages et en offrant de nouvelles possibilités de créativité aux professionnels de l'audiovisuel.

La convergence de l'IA et de la vidéo ouvre des horizons infinis dans la production de contenu vidéo, alliant efficacité et créativité pour répondre aux besoins d'une audience toujours plus exigeante. Alors que ces technologies continuent de se développer, nous pouvons nous attendre à voir émerger de nouvelles formes de narration visuelle et auditive.

Les innovations à suivre : 

  • StableDiffusion lance Stable Audio, une solution pour créer des sons et de la musique de manière simplifiée.
  • Substack offre une fonctionnalité d'IA qui transforme les articles de blog en audio, offrant ainsi une nouvelle expérience de consommation de contenu.
  • Cadbury révolutionne les chansons d'anniversaire en Inde en utilisant pas moins de 4 IA génératives pour créer des musiques uniques en fonction du style musical choisi, des informations sur la personne et des anecdotes personnelles.
  • Warner Music a conclu un contrat discographique avec Noonoouri, la première chanteuse pop virtuelle et influenceuse Instagram. Bien que la création de l'image de Noonoouri relève davantage de la CGI (infographie générée par ordinateur), sa voix est générée par une IA générative, ouvrant ainsi la voie à de nouvelles formes de créativité musicale.
  • synclabs.so propose une technologie similaire, mais dans le domaine des dessins animés, permettant la création de contenus animés de manière plus efficace et novatrice.

Retrouvez le BIG RECAP des actualités de l’IA Générative chaque semaine grâce à la HUBRADAR. Abonnez-vous

Le HUB Institute et Emmanuel Vivier

Retour aux articles