Reinforcement Learning Demo

我的第一个开源项目

运行环境

tensorflow 2.11

gym 0.26.2

python 3.8

游戏环境

根据动作状态空间是否连续，考虑两种游戏环境：

离散环境 CartPole-v0
连续环境 Pendulum-v1

算法列表

Q-Learning

SARSA

Double DQN

Dueling DQN

REINFORCEMENT

ActorCritic

Advantage ActorCritic

DDPG

TD3

SAC

SAC with automatic entropy tuning

PPO

Behavior Cloning

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
REINFORCEMENT		REINFORCEMENT
a2c		a2c
ac		ac
basic		basic
behavior_cloning		behavior_cloning
ddpg		ddpg
dqn		dqn
dueling_dqn		dueling_dqn
ppo_v1		ppo_v1
ppo_v2		ppo_v2
ppo_v3		ppo_v3
sac_v1		sac_v1
sac_v2		sac_v2
td3		td3
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reinforcement Learning Demo

运行环境

游戏环境

算法列表

About

Releases

Packages

Languages

License

houchangmeng/Reinforcement-Learning

Folders and files

Latest commit

History

Repository files navigation

Reinforcement Learning Demo

运行环境

游戏环境

算法列表

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages