Chacun des six Poppy Torso doit apprendre de façon autonome en explorant ce qu’il y a autour de lui pour manier les manettes. Quand le robot est lancé il ne sait rien au début; mais il est doté d’un algorithme de curiosité (curiosity driven learning), il se choisit des buts lui-même : par exemple, il constate la présence d’un joystick, il essaie de le bouger, s’il ne se passe rien il essaie autre chose. Il y a une part d’aléatoire au début, puis le robot s’adapte en fonction de ce qu’il arrive à faire et mesure lui-même son progrès. Chaque mouvement dure 5 secondes, il choisit le mouvement suivant en fonction de ce qu’il a fait avant. Les joysticks permettent de bouger le robot blanc (ergo-robot) qui peut alors attraper la balle. C’est le même algorithme sur les six, Poppy Torso, mais chacun va évoluer différemment ; l’apprentissage peut être différent, mais au bout de quelques heures ils arrivent tous au même stade. Le fait d’en avoir six permet de tester différentes versions de l’algorithme pour l’améliorer. A noter également la présence à côté des Poppy Torso d'un distracteur : un ergo-robot non contrôlable ce que Poppy torso ignore au début.
|