Transformer des mots en images avec un IA ?

2:47
 
Partager
 

Manage episode 308184353 series 2709331
Par raphael@acast.com and Choses à Savoir, découvert par Player FM et notre communauté - Le copyright est détenu par l'éditeur, non par Player F, et l'audio est diffusé directement depuis ses serveurs. Appuyiez sur le bouton S'Abonner pour suivre les mises à jour sur Player FM, ou collez l'URL du flux dans d'autre applications de podcasts.

Et s’il suffisait simplement d’écrire quelques mots pour qu’une image prenne forme ? C’est la promesse faite par le nouveau programme d’NVIDIA, basé sur une intelligence artificielle. Si elle n’en est encore qu’à ses débuts, cette technologie est très prometteuse. C’est ce que je vous propose de voir dans cet épisode.


Concrètement, il suffit tout simplement de saisir une phrase courte dans une barre de recherche et comme par magie, l’écran vous affiche une image illustrant votre requête. Dit comme ça, difficile de voir la différence entre Google Image et la technologie proposée par NVIDIA… Sauf que oui, il y en a bien une… en fait, il ne s’agit pas d’une photo ou d’une illustration déjà existante dans une banque d’image, mais bien d’une création originale générée par le logiciel lui-même. Dans le détail, ce programme s’intitule GauGAN 2… et si vous suivez l’actualité de NVIDIA, alors ce nom vous en rappelle sans doute un autre déjà présentée par la marque en 2019. Et bien, il s’agit de son grand frère. À l'époque, GauGAN permettait déjà de transformer des croquis en images photoréalistes… et aujourd’hui, avec GauGAN 2, Nvidia propose de faire la même chose avec des mots cette fois, ce qui est assez pratique si l’on dessine mal.


Dans le détail, comment GauGAN 2 fait-il pour transformer les mots en images ? Pour faire simple, cette technologie utilise une intelligence artificielle qui a été entraîné à partir de 10 millions d'images de paysages. Petit bémol toutefois, ses difficultés à improviser. En effet, si l’on utilise des mots clés qui peuvent avoir plusieurs sens ou qui sont un peu trop subtils pour le logiciel, et bien l’image n’aura probablement rien à voir avec le résultat que vous cherchez à obtenir. Ceci dit, GauGAN 2 n’en est qu’à ses débuts et propose quand même de combiner le texte et les dessins pour obtenir un résultat encore plus précis. Le procédé permet donc d'aller plus loin dans la personnalisation du rendu en s'appuyant sur le croquis. Pour les curieux, Nvidia propose de tester l'IA depuis votre navigateur… Si la page affiche un message d’erreur, n’hésitez pas à la rafraîchir autant que nécessaire, et elle devrait finir par s’afficher… en tout cas, ça a fonctionné pour moi. À noter qu’il vous faudra peut-être quelques minutes pour appréhender l’aspect un peu brut de la page, qui, si elle a été pensée pour être la plus intuitive possible, n’est en réalité pas si facile à maîtriser que ça au premier abord. Quoiqu’il en soit, GauGAN est une technologie pleine de promesses qui a coup sûr devrait trouver des applications concrètes à l’avenir.


GauGAN 2 : http://gaugan.org/gaugan2/


Voir Acast.com/privacy pour les informations sur la vie privée et l'opt-out.

Learn more about your ad choices. Visit megaphone.fm/adchoices

471 episodes