Validation du cours
lundi 11 avril 2011 (ENS de Cachan, salle C102) :
9h30 El Alaoui Issam Florian, A reinforcement learning algorithm for spiking neural networks (2005) ; Dayan & Daw, Decision theory, reinforcement learning, and the brain (2008)
10h10 Huang Weibing Mongillo, Barak & Tsodyks, Synaptic Theory of Working Memory, Science 2008
11h10 Gauthier Romain R. Axelrod, The Dissemination of Culture, 1997; N Lanchier, The Axelrod model for the dissemination of culture revisited, 2010
11h50 Titon Myriam Efficiency of Competitions, E. Ben-Naim and N.W. Hengartner (2007)
lundi 18 avril (ENS de Cachan, salle C102) :
10h20 Dreano Denis (K-sat)
11h00 Mesnil Alex E. Ben-Naim, S. Redner, F. Vazquez, Scaling in Tournaments (2007)
mercredi 27 avril (heure et lieu à préciser) :
Hammad Imad Niv et al (2002) - Evolution of Reinforcement Learning in Uncertain Environments: A Simple Explanation for Complex Foraging Behaviors
Gharsalli Leila Opper, M. and Urbanczik, R., Asymptotic Universality for Learning Curves of Support Vector Machines (2002)
Modalités :
A partir du (des) articles(s) lu(s) :
présentation critique + contribution personnelle
(simulation numérique, analyse plus en profondeur d'un aspect mathématique...)
Présentation orale 20mn + 10 à 15mn de questions sur l'exposé et sur le cours.
Rapport écrit ~ 10 pages (à rendre de préférence au plus tard le jour même).