Scidown文献预览系统!
建模多gpu系统预打印10.3233/978-1-60750-530-3-562( Modelling Multi-GPU Systems Pre-print of 10.3233/978-1-60750-530-3-562 )
DG Spampinato AC Elster T Natvig
由于功率和频率墙,现在的趋势是在给定的系统上使用多个GPU,就像你会在基于CPU的系统上发现多个内核一样。然而,增加资源的层次结构会扩大可能影响系统性能的因素的范围。本文的目标是通过对NVIDIA Tesla S1070的调查和标杆分析这些因素。该系统结合了四个T10 GPU,提供了多达4个TFLOPS的计算能力。作为一个实例研究,我们开发了一个红-黑SOR偏微分方程求解器,用于求解具有Dirichlet边界的Laplace方程,该方程因需要不断通信以交换相邻数据而闻名。为了帮助设计和分析,我们提出了一个针对多个GPU之间通信的多GPU系统模型。我们的基准应用程序公开的主要变量是:域大小和形状、数据分区的类型、GPU的数量、要交换的边界宽度、要使用的内核以及GPU上下文之间的同步类型。我们展示了多GPU系统从在非常大的数据量上使用其所有的四个GPU中得到极大的好处。四个GPU的速度几乎是单个GPU的四倍。结果还允许我们改进静态通信模型。
『Sci-Hub|Scidown』怎么用?来看看教程吧!

支持模式 1.支持DOI号 2.支持英文文献全名搜索 3.支持参考文献搜索 4.知网文献(暂时关闭)


安卓手机、电脑用户,您可以在QQ浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!(注意是文献的DOI号)


苹果手机用户,您需要先在App Store里搜索并下载 Documents by Readdle 这个APP,在APP首页,左划右下角的指南针图标打开APP内置浏览器,在浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!


如出现BUG?赶快加入【Scidown互助交流群】反馈吧:729083885【点击一键加群】