CPL - Chalmers Publication Library
| Utbildning | Forskning | Styrkeområden | Om Chalmers | In English In English Ej inloggad.

Generalised entropy MDPs and Minimax Regret

Emmanouil Androulakis (Institutionen för matematiska vetenskaper) ; Christos Dimitrakakis (Institutionen för data- och informationsteknik, Datavetenskap, Algoritmer (Chalmers))
NIPS 2014, From bad models to good policies workshop. (2014)
[Konferensbidrag, refereegranskat]

Bayesian methods suffer from the problem of how to specify prior beliefs. One interesting idea is to consider worst-case priors. This requires solving a stochastic zero-sum game. In this paper, we extend well-known results from bandit theory in order to discover minimax-Bayes policies and discuss when they are practical.



Den här publikationen ingår i följande styrkeområden:

Läs mer om Chalmers styrkeområden  

Denna post skapades 2015-01-07. Senast ändrad 2015-09-14.
CPL Pubid: 209984

 

Läs direkt!


Länk till annan sajt (kan kräva inloggning)