基于强化学习的跳一跳游戏机器人

由于我的组员，也是我的舍友，超级热爱Dota。我就萌生了要不就搞一下游戏AI的想法。但是经过了解， DotaAI 或者王者荣誉的AI实在是太难了！！��所以，我们选择了。。。。做跳一跳游戏AI。

但是！！！！ Dota AI是终极追求！！，下一步先做其他游戏的AI。

尽管算法很精准，但是，存在一个棋盘，导致检测关键点的位置有误差。所以，我们需要使用成熟的图像数字识别技术获取每一帧的分数

实现细节

为了快速收敛。

但是，我牺牲了DQN的优点，没有使用Fixed Q-target。因为在这个游戏里面，容忍忍受的误差范围太小，所以，我没有使用Fixed Q-target，让神经网络及时更新最新的参数和结果。

同时，我缩小了记忆库的范围，并没有让AI随机抽取学习，为了让它快速收敛，我取最前的几条记忆库的数据来学习。

还有，我调整了e-贪婪的参数，逐步增长的随机阈值为0.05，表示20轮之后会采用完全贪婪的方式来选取action。

问额还有很多，希望各位志同道合的小伙伴跟我一起优化。

Name	Name	Last commit message	Last commit date
Latest commit shaneson0 跳一跳中文乱码问题 Jun 28, 2019 d1cb178 · Jun 28, 2019 History 5 Commits
__pycache__	__pycache__	version 1	Jun 17, 2019
common	common	version 1	Jun 17, 2019
config	config	version 1	Jun 17, 2019
logs	logs	version 1	Jun 17, 2019
pic	pic	修改图片	Jun 20, 2019
resource	resource	version 1	Jun 17, 2019
screenshot_backups	screenshot_backups	version 1	Jun 17, 2019
tensorFlow	tensorFlow	version 1	Jun 17, 2019
RL_brain.py	RL_brain.py	version 1	Jun 17, 2019
after_autojump_temp.png	after_autojump_temp.png	version 1	Jun 17, 2019
autojump.png	autojump.png	version 1	Jun 17, 2019
autojump_temp.png	autojump_temp.png	version 1	Jun 17, 2019
main.py	main.py	version 1	Jun 17, 2019
maze_env.py	maze_env.py	跳一跳中文乱码问题	Jun 28, 2019
readme.md	readme.md	修改reamde	Jun 20, 2019
region0.png	region0.png	version 1	Jun 17, 2019
region1.png	region1.png	version 1	Jun 17, 2019
region2.png	region2.png	version 1	Jun 17, 2019