Scidown文献预览系统!
持续强化学习中的多任务学习与灾难性遗忘( Multi-task Learning and Catastrophic Forgetting in Continual Reinforcement Learning )
J Ribeiro FS Melo J Dias
在本文中,我们研究了关于深度强化学习在多任务中使用的两个假设。第一个假设是由一个问题驱动的,即在两个相似任务上训练的深度强化学习算法是否能够通过更有效地学习一个新的相似任务来超过两个单个任务、单独训练的算法,这三个算法中没有一个以前遇到过。第二个假设是由这样一个问题驱动的:同一个多任务深度RL算法,在两个相似的任务上训练,并用弹性权重合并(EWC)增强,在新任务上是否能够保持与没有EWC的相似算法相似的性能,同时能够克服前两个任务中的灾难性遗忘。我们证明了一个多任务异步Advantage Actor-Critic(GA3C)算法,在空间入侵者和恶魔攻击上训练,在新的第三个任务(即凤凰)上评估时,实际上能够优于针对每个单个任务单独训练的两个单任务GA3C版本。我们还表明,当训练两个训练过的多任务GA3C算法对第三个任务进行训练时,如果其中一个算法用EWC增强,它不仅能够在新任务上获得相似的性能,而且能够克服前两个任务上大量的灾难性遗忘。
『Sci-Hub|Scidown』怎么用?来看看教程吧!

支持模式 1.支持DOI号 2.支持英文文献全名搜索 3.支持参考文献搜索 4.知网文献(暂时关闭)


安卓手机、电脑用户,您可以在QQ浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!(注意是文献的DOI号)


苹果手机用户,您需要先在App Store里搜索并下载 Documents by Readdle 这个APP,在APP首页,左划右下角的指南针图标打开APP内置浏览器,在浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!


如出现BUG?赶快加入【Scidown互助交流群】反馈吧:729083885【点击一键加群】