使用Gym和CNN构建多智能体自动驾驶马
2024/8/20 来源:不详本文描述的卷积神经网络超出了简单模式识别的范畴,能够学习到控制一辆自动汽车所需的所有过程。作者介绍了如何利用CNN和OpenAIGym,创建一个多智能体的系统,这些模型可以自动驾驶马里奥赛车,并且彼此竞争。
对机器学习感兴趣的人都知道基于人工智能的强化学习的能力。过去的纪念见证了很多使用强化学习(RL)做出的突破。DeepMind将强化学习与机器学习相结合,在很多Atari游戏中达到了超越人类的结果,并且在年3月的时候以4:1的成绩击败了围棋冠军李世石。尽管强化学习目前在很多游戏环境中超越了人类,但是用它来解决一些需要最优决策和效率的问题还是比较新颖的,而且强化学习也会在未来的机器智能方面起到重要的作用。
简单地解释,强化学习就是智能体通过采取行动与环境交互以尝试最大化所得的积累奖励的计算方法。下面是一张简图(智能体—环境循环),图来自于强化学习简介(第二版)(ReinforcementLearning:AnIntroduction2ndEdition,