Munchausen Actor Critic using PyTorch

The code was adapted from Toshiki Watanabe, please check the original page for update and credit.

The base algorithm is SAC discrete [1] for my own research purpose, might add the continuous version later.

Munchausen Reinforcement Learning [2]

The original paper introduces Munchausen trick only on top of DQN, here I try to extend it to actor critic style, this requires exploration on the suitable policy loss.

References

[1] Christodoulou, Petros. "Soft Actor-Critic for Discrete Action Settings." arXiv preprint arXiv:1910.07207 (2019).

[2] Nino Vieillard, Olivier Pietquin, Matthieu Geist, "Munchausen Reinforcement Learning." NeurIPS (2020).

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.idea		.idea
Munchausen_actorcritic_discrete		Munchausen_actorcritic_discrete
config		config
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
plots.py		plots.py
requirements.txt		requirements.txt
run_benchmark.bash		run_benchmark.bash
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Munchausen Actor Critic using PyTorch

Munchausen Reinforcement Learning [2]

References

About

Releases

Packages

Languages

License

lingweizhu/Pytorch-MunchausenActorCritic

Folders and files

Latest commit

History

Repository files navigation

Munchausen Actor Critic using PyTorch

Munchausen Reinforcement Learning [2]

References

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages