Un salon automobile, des interviews de visiteurs, des plans soignés et des phrases typiques de micro-trottoir. Sauf que rien de tout ça n’est réel. Pas un seul plan n’a été filmé, aucun personnage n’existe, même les voix ont été inventées. Cette vidéo virale publiée par László Gaál a été générée de A à Z par Veo 3, le nouvel outil d’intelligence artificielle de Google. Et le résultat est vraiment bluffant !
Un salon automobile qui n’a jamais existé
« Welcome to a non-existent car show. » Voilà comment commence la vidéo. Et ce n’est pas une métaphore : ce salon automobile n’existe pas. Chaque plan de caméra, chaque personnage, chaque parole a été inventé par l’IA à partir de simples prompts textuels.
Car Veo 3, la dernière prouesse de Google DeepMind, est capable de générer des clips vidéo d’environ 10 secondes à partir d’une seule ligne de texte. Et ici, László Gaál a pris plusieurs clips générés séparément, puis les a montés ensemble pour créer un faux reportage d’1 min 10. Le résultat est saisissant de réalisme. Voyez plutôt :
Une IA qui comprend le style documentaire
Ce qui frappe, ce n’est pas juste la qualité des images. C’est le style parfaitement calqué sur un reportage bien réel :
- Des mouvements de caméra naturels
- Une ambiance sonore cohérente
- Des visages crédibles avec des mimiques typiques
- Et surtout : des dialogues réalistes générés par l’IA
Même les hésitations, les tics de langage et les réponses un peu absurdes font partie du charme de cette démonstration. Voici quelques exemples :
« I mean, man, the acceleration is crazy. You look far, step on the pedal, and you are there. » (Je veux dire, l’accélération est dingue. Tu regardes au loin, tu appuies sur la pédale, et tu y es.)
« I think the range is only… only going to get better. Sorry. We don’t want to drive gas cars anymore. » (Je pense que l’autonomie va encore s’améliorer. Désolé. On ne veut plus rouler en voiture à essence.)
« Yeah, you can see, uh, I’m kind of a kind of a misfit here, but, uh, don’t tell anyone I’ve just bought an electric car. » (Ouais, tu vois, je suis un peu un marginal ici, mais ne le dis à personne, je viens juste d’acheter une voiture électrique.)
Ces phrases peuvent sembler décalées ou peu naturelles, mais dans le contexte d’un micro-trottoir en vidéo, elles paraissent crédibles. On retrouve le ton hésitant, les petites maladresses et les transitions étranges qu’on entend souvent dans des interviews réelles.
Une nouvelle ère pour la vidéo générée par IA
Ce n’est pas la première démo bluffante de génération vidéo par IA, mais ici, le niveau de réalisme franchit un cap. Et ça commence à poser des questions : que va-t-on croire en regardant une vidéo dans un an, deux ans ? Une fausse pub, un faux événement, une fausse déclaration politique… les dérives sont faciles à imaginer. Mais d’un point de vue technologique, c’est impressionnant.
Pour l’heure, Veo 3 est uniquement disponible aux États-Unis. Mais une fois déployé dans davantage de pays, on risque de voir circuler encore plus de vidéos aussi bluffantes que celle-ci… ou peut-être plus inquiétantes aussi.
Source : LinkedIn
Ah ouais c’est vraiment une dinguerie et ce n’est que le début… j’imagine même pas la suite. J’espère quand même qu’ils vont mettre des choses en place pour éviter les dérives.