Google crée une nouvelle équipe pour développer une IA capable de simuler le monde physique

IA capable de simuler le monde physique

Dans sa quête d’innovation en intelligence artificielle, Google franchit une nouvelle étape en formant une équipe spécialisée dans le développement de modèles génératifs capables de simuler le monde physique. Ce projet ambitieux, piloté par Tim Brooks, s’inscrit dans la continuité des travaux menés par Google DeepMind, le laboratoire de recherche en IA de l’entreprise.

Une nouvelle équipe pour une mission ambitieuse

Tim Brooks, ancien co-leader chez OpenAI sur le générateur vidéo Sora, a rejoint Google DeepMind en octobre dernier. Il a annoncé la création de cette équipe sur X (anciennement Twitter), affirmant que l’objectif est de créer des modèles d’IA massifs capables de simuler le monde.

Selon les offres d’emploi partagées par Brooks, l’équipe collaborera avec les divisions déjà existantes chez Google, notamment celles travaillant sur les modèles Gemini, Veo et Genie, afin de résoudre de nouveaux problèmes critiques et de faire évoluer ces modèles vers des capacités de calcul encore plus avancées.

Les piliers du projet : Gemini, Veo et Genie

Ces noms ne sont pas anodins dans l’univers de Google :

  • Gemini, la série phare de modèles d’IA de Google, excelle dans des tâches comme l’analyse d’images et la génération de texte.
  • Veo se concentre sur la génération vidéo, un domaine en pleine expansion.
  • Genie est un modèle de « world building », capable de générer des environnements 3D en temps réel. Lors de sa dernière démonstration en décembre, Genie a montré qu’il pouvait créer une variété infinie de mondes jouables, repoussant les limites de l’interactivité numérique.

Pourquoi viser la simulation du monde physique ?

Google s’inscrit dans une vision à long terme : développer une intelligence artificielle générale (AGI), une IA capable d’accomplir toutes les tâches qu’un humain peut réaliser. Pour atteindre cet objectif, l’entraînement des modèles sur des données multimodales, incluant vidéo et simulation, est jugé indispensable. Ces modèles pourraient un jour alimenter des domaines variés comme :

  • Le raisonnement visuel et les simulations complexes.
  • La planification pour des agents incarnés (robots autonomes).
  • Les jeux interactifs en temps réel et les divertissements immersifs.

Tim Brooks et son équipe travailleront également sur des outils de génération interactive en temps réel, visant à intégrer ces modèles dans des systèmes multimodaux comme Gemini.

Applications et enjeux éthiques

Les modèles de simulation ouvrent la voie à des avancées impressionnantes dans les domaines du divertissement et de la robotique. Des entreprises et startups comme Odyssey ou World Labs explorent déjà ces technologies pour créer des jeux vidéo, des films interactifs et des environnements d’entraînement réalistes pour robots.

Cependant, ces innovations ne sont pas sans controverse. Une enquête récente a révélé que certaines entreprises, comme Activision Blizzard, utilisent l’IA pour réduire les coûts et accélérer la production, entraînant des licenciements massifs. De plus, une étude commandée par le Animation Guild prévoit que plus de 100 000 emplois dans le cinéma, la télévision et l’animation pourraient être impactés par l’IA d’ici 2026.

Propriété intellectuelle : un sujet brûlant

Un autre défi de taille pour Google est la gestion des droits d’auteur. Certains modèles de simulation seraient entraînés sur des vidéos de gameplay ou d’autres contenus protégés par des droits d’auteur, ce qui pourrait exposer les entreprises à des poursuites judiciaires. Google, qui possède YouTube, affirme respecter les conditions d’utilisation de la plateforme pour l’entraînement de ses modèles, mais reste évasif sur les vidéos spécifiques utilisées.

Une technologie prometteuse, mais à encadrer

Le projet de Google visant à développer une IA capable de simuler le monde physique est une avancée majeure dans le domaine des modèles génératifs. Cependant, son succès dépendra de sa capacité à collaborer avec les créateurs et à respecter les limites éthiques et juridiques.

Alors que l’avenir des technologies immersives se dessine, il reste à voir si Google parviendra à concilier innovation technologique et respect des intérêts humains.

4/5 - (11 votes)
Retour en haut