Advantage Based Value Iteration for Markov Decision Processes with Unknown Rewards

Pegah Alizadeh 1 Yann Chevaleyre 1 François Lévy 2
2 RCLN
LIPN - Laboratoire d'Informatique de Paris-Nord
Type de document :
Communication dans un congrès
International Joint Conference on Neural Networks (IJCNN 2016), Jul 2016, Vancouver, Canada
Liste complète des métadonnées

https://hal-auf.archives-ouvertes.fr/hal-01358345
Contributeur : François Lévy <>
Soumis le : mercredi 31 août 2016 - 15:19:17
Dernière modification le : jeudi 11 janvier 2018 - 06:26:42

Identifiants

  • HAL Id : hal-01358345, version 1

Collections

Citation

Pegah Alizadeh, Yann Chevaleyre, François Lévy. Advantage Based Value Iteration for Markov Decision Processes with Unknown Rewards. International Joint Conference on Neural Networks (IJCNN 2016), Jul 2016, Vancouver, Canada. 〈hal-01358345〉

Partager

Métriques

Consultations de la notice

216