Search Results for author: Jaime Sabal Bermúdez

Found 1 papers, 1 papers with code

Distributional constrained reinforcement learning for supply chain optimization

1 code implementation • 3 Feb 2023 • Jaime Sabal Bermúdez, Antonio del Rio Chanona, Calvin Tsay

We introduce Distributional Constrained Policy Optimization (DCPO), a novel approach for reliable constraint satisfaction in RL.

Distributional Reinforcement Learning Policy Gradient Methods +2

8

Paper
Code

Cannot find the paper you are looking for? You can Submit a new open access paper.