Search Results for author: Damiano Binaghi

Found 1 papers, 1 papers with code

Stochastic Variance-Reduced Policy Gradient

1 code implementation • ICML 2018 • Matteo Papini, Damiano Binaghi, Giuseppe Canonaco, Matteo Pirotta, Marcello Restelli

In this paper, we propose a novel reinforcement- learning algorithm consisting in a stochastic variance-reduced version of policy gradient for solving Markov Decision Processes (MDPs).

Paper
Code

Cannot find the paper you are looking for? You can Submit a new open access paper.