Anthropic a lancé une expérience inédite sur Twitch : Claude 3.7 Sonnet, son dernier modèle d’intelligence artificielle, joue à Pokémon Rouge en direct. Cet événement attire l’attention sur les capacités actuelles des IA, tout en suscitant des réactions partagées entre amusement et frustration.
Un test grandeur nature des capacités de l’IA
Depuis des années, les chercheurs en intelligence artificielle utilisent des jeux vidéo pour tester leurs modèles, de Street Fighter à Pictionary. Pokémon Rouge s’est révélé être un excellent terrain d’expérimentation pour Claude 3.7 Sonnet, qui doit résoudre les énigmes du jeu comme un joueur humain.
Alors que son prédécesseur, Claude 3.5 Sonnet, échouait à quitter la maison du joueur au début du jeu, Claude 3.7 a déjà remporté trois badges d’arène. Cependant, ses progrès restent laborieux : bloqué face à un mur de pierre, le modèle a mis plusieurs minutes avant de comprendre comment le contourner.
“Qui va gagner : une IA programmée pendant des milliers d’heures ou un simple mur de pierre ?” a ironiquement commenté un spectateur sur Twitch.
Chaque action de Claude est scrutée en direct, rendant le spectacle à la fois frustrant et captivant. Lorsqu’il a tenté de localiser le Professeur Chen dans son laboratoire, l’IA a confondu un autre personnage non-joueur avec le scientifique, provoquant l’exaspération des spectateurs.
Certains utilisateurs ont rappelé qu’eux-mêmes avaient peiné à progresser dans le jeu lorsqu’ils étaient enfants, rendant l’expérience plus amusante que réellement frustrante.
Une évocation nostalgique de “Twitch Plays Pokémon”
L’expérience d’Anthropic rappelle un autre moment marquant de Twitch : “Twitch Plays Pokémon”, où des milliers de joueurs tentaient de contrôler un personnage en donnant des instructions via le chat. Ce chaos organisé était devenu un véritable phénomène communautaire en 2014.
Certains chercheurs en IA s’en sont inspirés pour développer leurs propres expériences. En 2023, l’ingénieur Peter Whidden a ainsi conçu un modèle d’apprentissage par renforcement qui a passé 50 000 heures à apprendre à jouer à Pokémon Rouge. Cependant, son IA préférait souvent admirer les décors pixelisés plutôt que d’avancer dans le jeu.
Si ces expériences IA sont fascinantes, elles soulèvent aussi une réflexion sur l’évolution d’Internet. Contrairement à l’époque de “Twitch Plays Pokémon“, où l’aspect collectif était central, nous sommes aujourd’hui devenus de simples spectateurs devant une IA qui tente, laborieusement, de jouer à un jeu que nous avons maitrisés dès notre enfance. Une expérience à la fois fascinante et un peu mélancolique.