Search Results for author: Henry Sowerby

Found 2 papers, 1 papers with code

Tiered Reward Functions: Specifying and Fast Learning of Desired Behavior

1 code implementation • 7 Dec 2022 • Zhiyuan Zhou, Shreyas Sundara Raman, Henry Sowerby, Michael L. Littman

Reinforcement-learning agents seek to maximize a reward signal through environmental interactions.

Paper
Code

Designing Rewards for Fast Learning

no code implementations • 30 May 2022 • Henry Sowerby, Zhiyuan Zhou, Michael L. Littman

To solve this optimization problem, we propose a linear-programming based algorithm that efficiently finds a reward function that maximizes action gap and minimizes subjective discount.

Q-Learning Reinforcement Learning (RL)

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.