Scidown文献预览系统!
通过深度强化学习-专家演示-行为克隆过程的主动控制挡板的晃动抑制( Sloshing suppression with active controlled baffles through deep reinforcement learning–expert demonstrations–behavior cloning process )
Y Xie X Zhao
本文提出了一种充分利用深度强化学习(DRL)和专家知识寻找最优控制策略的有效范式。该范式包括三个部分:DRL、专家演示和行为克隆。本文首次将所提出的方法应用于有两个主动控制水平挡板的液舱晃动抑制中。同时,利用自行研制的计算流体力学(CFD)求解器对储罐晃动环境进行了数值模拟。对于直接DRL,测试了近端策略优化agent和双延迟深度确定性策略梯度agent的学习性能。不同算法得到的策略即使在相同的环境下也不一定是统一的。然后,我们导出了一种基于直接DRL的简化参数控制策略。最后,利用带有行为克隆的DRL对简化的参数控制策略进行优化。经过训练,智能体能主动控制挡板,晃动减少81.48%。对水面高程的傅里叶分析表明,采用行为克隆的DRL控制策略的目的是通过挡板的快速振荡来分散波浪能量,改变水舱的晃动频率。这提供了一种抑制晃动的思路,类似于迫使波浪提前解体。从本研究中获得的经验和见解表明DRL+CFD未来的发展方向是如何将DRL、专家演示和行为克隆耦合起来。
『Sci-Hub|Scidown』怎么用?来看看教程吧!

支持模式 1.支持DOI号 2.支持英文文献全名搜索 3.支持参考文献搜索 4.知网文献(暂时关闭)


安卓手机、电脑用户,您可以在QQ浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!(注意是文献的DOI号)


苹果手机用户,您需要先在App Store里搜索并下载 Documents by Readdle 这个APP,在APP首页,左划右下角的指南针图标打开APP内置浏览器,在浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!


如出现BUG?赶快加入【Scidown互助交流群】反馈吧:729083885【点击一键加群】