Scidown文献预览系统!
快速系统中的多智能体协同强化学习( Cooperative Multi-Agent Reinforcement Learning in Express System )
Y Li Y Zheng Q Yang
快递系统在许多主要城市都有广泛的部署。系统中的一类重要任务是及时从客户手中取走包裹。由于取件请求是实时来的,而且取件的快递员很多,如何调度快递员来保证他们之间的配合,并在较长时间内完成更多的取件任务,这是非常重要但又具有挑战性的。在本文中,我们提出了一个基于强化学习的框架来学习快递配送策略。首先,我们将城市划分为独立的区域,每个区域内都有数量不变的快递员同时取走包裹。除降低问题复杂度外,城市划分还有实际操作的好处。之后,我们分别关注每个区域。针对每个区域,我们提出了一个协作多智能体强化学习模型,即CMARL,在其中学习最优的快递员调度策略。CMARL试图使所有快递员在较长时间内完成的取件任务总数最大化。我们的模型通过结合两个马尔可夫决策过程来实现这一目标,一个保证快递员之间的合作,另一个保证长期优化。在得到这两个MDP的价值函数后,设计了一个新的价值函数对它们进行折衷,据此我们可以推断出快递配送策略。以北京市实际路网数据和历史快速数据为基础进行了实验,验证了该模型与9条基线相比的优越性。
『Sci-Hub|Scidown』怎么用?来看看教程吧!

支持模式 1.支持DOI号 2.支持英文文献全名搜索 3.支持参考文献搜索 4.知网文献(暂时关闭)


安卓手机、电脑用户,您可以在QQ浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!(注意是文献的DOI号)


苹果手机用户,您需要先在App Store里搜索并下载 Documents by Readdle 这个APP,在APP首页,左划右下角的指南针图标打开APP内置浏览器,在浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!


如出现BUG?赶快加入【Scidown互助交流群】反馈吧:729083885【点击一键加群】