Scidown文献预览系统!
基于蒙特卡罗树搜索的自动驾驶汽车安全强化学习( Safe Reinforcement Learning for Autonomous Vehicle Using Monte Carlo Tree Search )
S Mo X Pei C Wu
强化学习在自动驾驶中逐渐展现了其决策能力。强化学习是学习如何通过与环境的相互作用将状态映射到行动,从而使长期收益最大化。在有限的交互作用下,学习者将根据设计的奖励函数获得合适的驾驶策略。然而,传统的强化学习在训练过程中会出现很多不安全的行为。提出了一种基于RL agent和蒙特卡罗树搜索算法相结合的减少不安全行为的方法。提出的安全强化学习框架主要由两个模块组成:风险状态估计模块和安全策略搜索模块。一旦风险状态估计模块使用当前状态信息和RL代理输出的动作计算出未来状态是有风险的,则基于MCTS的安全策略搜索模块将激活,以通过增加对风险动作的额外奖励来保证更安全的探索。我们在几个随机超车场景中测试了该方法,与传统的强化学习相比,它具有更快的收敛速度和更安全的行为。
『Sci-Hub|Scidown』怎么用?来看看教程吧!

支持模式 1.支持DOI号 2.支持英文文献全名搜索 3.支持参考文献搜索 4.知网文献(暂时关闭)


安卓手机、电脑用户,您可以在QQ浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!(注意是文献的DOI号)


苹果手机用户,您需要先在App Store里搜索并下载 Documents by Readdle 这个APP,在APP首页,左划右下角的指南针图标打开APP内置浏览器,在浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!


如出现BUG?赶快加入【Scidown互助交流群】反馈吧:729083885【点击一键加群】