IA

Voici Genie 2, le nouveau modèle de Google DeepMind capable de générer des mondes 3D interactifs

L'IA est capable de générer des scènes interactives en temps réel à partir d'une seule image ou description textuelle

Voici Genie 2, le nouveau modèle de Google DeepMind capable de générer des mondes 3D interactifs

Pedro Domínguez

  • 5 décembre 2024
  • Mise à jour: 12 juin 2025 à 09:22
Voici Genie 2, le nouveau modèle de Google DeepMind capable de générer des mondes 3D interactifs

DeepMind, la division de recherche en intelligence artificielle de Google, vient de dévoiler Genie 2, un modèle innovant capable de créer une variété apparemment infinie de mondes tridimensionnels jouables. Ce modèle, qui succède à Genie, lancé au début de cette année, se distingue par sa capacité à générer des scènes interactives en temps réel à partir d’une seule image ou description textuelle, comme « un robot humanoïde dans l’Égypte antique ». Bien qu’il rappelle les développements de sociétés comme World Labs et Decart, Genie 2 possède des caractéristiques qui le rendent unique.

La proposition de DeepMind promet une immense diversité de mondes 3D riches en détails, où les utilisateurs peuvent effectuer des actions comme sauter ou nager avec le clavier et la souris. Grâce à son entraînement avec des vidéos, Genie 2 peut simuler des interactions d’objets, des animations, l’éclairage, la physique et même le comportement des personnages non joueurs (PNJ). Beaucoup de ces mondes rappellent des jeux vidéo AAA, ce qui soulève de sérieuses questions quant à la possible inclusion de parties de jeux populaires dans son entraînement. Pour l’instant, DeepMind a évité de révéler des détails sur la manière dont les données ont été collectées.

Le modèle a également relancé le débat sur la propriété intellectuelle. En effet, en tant que filiale de Google, DeepMind peut accéder aux vidéos de YouTube, et l’entreprise elle-même a indiqué que ses conditions d’utilisation permettent l’utilisation de ces contenus pour entraîner des modèles d’IA.

Malgré ses limitations, comme le fait que les simulations durent entre 10 et 60 secondes, Genie 2 est plus cohérent que d’autres modèles similaires. Par exemple, il évite les problèmes courants d’artefacts visuels et d’oubli de scènes, un problème qui affecte des concurrents comme Oasis, de Decart. De plus, il peut mémoriser et rendre des objets qui étaient sortis du champ de vision.

DeepMind ne considère pas ce modèle comme un outil pour les jeux traditionnels, mais comme une ressource créative et de recherche. Selon l’entreprise, « Genie 2 transforme l’art conceptuel en environnements interactifs complets » et facilite l’évaluation d’agents d’IA dans des tâches totalement nouvelles, ouvrant de nouvelles possibilités pour le prototypage et l’expérimentation.

Gémeaux TÉLÉCHARGER

Derniers articles

Chargement de l’article suivant