Chacun des six Poppy Torso doit apprendre de façon autonome en explorant ce qu’il y a autour de lui pour manier les manettes. Quand le robot est lancé il ne sait rien au début; mais il est doté d’un algorithme de curiosité (curiosity driven learning), il se choisit des buts lui-même : par exemple, il constate la présence d’un joystick, il essaie de le bouger, s’il ne se passe rien il essaie autre chose. Il y a une part d’aléatoire au début, puis le robot s’adapte en fonction de ce qu’il arrive à faire et mesure lui-même son progrès. Chaque mouvement dure 5 secondes, il choisit le mouvement suivant en fonction de ce qu’il a fait avant. Les joysticks permettent de bouger le robot blanc (ergo-robot) qui peut alors attraper la balle. L'algorithme d'apprentissage par curiosité est le même sur les six Poppy Torso, mais chacun peut évoluer différemment et apprendre différentes façon d'interagir avec les joysticks, mais au bout de quelques heures ils y arrivent tous. Le fait d’en avoir six permet de faire plus d'expériences pour avoir plus de statistiques sur l'apprentissage, mais aussi de tester différentes versions de l’algorithme pour pouvoir l’améliorer. A noter également la présence à côté des Poppy Torso d'un distracteur : un ergo-robot non contrôlable ce que Poppy torso ignore au début. Sébastien Forestier, doctorant au sein de l’équipe-projet Flowers.
|