概要

強化学習アルゴリズムの一つである PPO with Clipping を PyTorch ベースで実装し、 CartPole-v0 を解きます。

色々と参考にしたコードベースや本がありますが、個人の実装なのでバグ等あるかもしれません。あしからず。

できるだけシンプルなままのモデルで書いてみました。

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.gitignore		.gitignore
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback