A. Keijzer

Master thesis (1)

1 records found

Prioritizing states with action sensitive return in experience replay

Master thesis (2023) - A. Keijzer (author) , Jens Kober (mentor) , D.S. van der Heijden (mentor) , R Babuska (graduation committee member) , Wendelin Böhmer (graduation committee member)

Experience replay for off-policy reinforcement learning has been shown to improve sample efficiency and stabilize training. However, typical uniformly sampled replay includes many irrelevant samples for the agent to reach good performance. We introduce Action Sensitive Experience ...