应用程序linpack
linpack 时间:2021-03-26 阅读:(
)
TESLAV100性能指南深度学习和HPC应用程序2017年11月应用程序性能指南TESLAV100性能指南现代高性能计算(HPC)数据中心是解决全球一些重大科学和工程挑战的关键.
NVIDIATesla加速计算平台让这些现代数据中心能够使用行业领先的应用>程序加速完成HPC和AI领域的工作.
TeslaV100GPU是现代数据中心的>引擎,能够以更少的服务器提供突破性性能,从而加快探索发现的步伐,>并大幅降低成本.
改进的性能和解决方案时间对提高收益和生产力也有显著的有利影响.
每个HPC数据中心都可从Tesla平台中受益.
多个领域超过500款HPC应用程序已经过GPU优化,其中包括全部15大常用HPC应用程序以及各主要的深度学习框架.
超过500款HPC应用程序和各主要深度学习框架已支持GPU加速.
>>要获取GPU加速应用程序的最新目录,请访问:www.
nvidia.
cn/object/gpu-applications-cn>>如要获取适用于各种加速应用程序的简单指令,以实现GPU上的快速启动和运行,请访问:>www.
nvidia.
com/gpu-ready-apps使用GPU加速应用程序的研究领域包括:深度学习分子动力学量子化学物理学地球科学工程学HPC基准测试深度学习正在解决几年前还看似遥不可及的科学、企业级的和消费者层面的>重要问题.
各主要深度学习框架均支持NVIDIAGPU优化,从而使数据科学家和研究人员可以在工作中利用人工智能.
数据中心配有TeslaV100GPU后,在运行深度学习训练和推理框架时可节省高达85%的服务器和基础架构购置>成本.
深度学习训练适用的TESLA平台和V100的主要特性>借助TeslaV100,Caffe、TensorFlow和CNTK的速度可提升至高达3倍(与P100相比)>所有常用深度学习框架均支持GPU加速>TensorFlow运算能力高达125TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cnTESLAV100性能指南深度学习应用程序性能指南|深度学习CAFFE加州大学伯克利分校开发的一种热门GPU加速深度学习框架版本1.
0加速特性全框架加速可扩展性多GPU更多信息caffe.
berkeleyvision.
org应用程序性能指南|深度学习分子动力学(MD)代表HPC数据中心的大部分工作负载.
所有常用MD应用程序均已支持GPU加速,科学家们先前无法借助这些应用程序的传统>纯CPU版本执行的模拟,现在都可运行.
数据中心配有TeslaV100GPU后,>在运行MD应用程序时可节省高达80%的服务器和基础架构购买成本.
MD适用的TESLA平台和V100的主要特性>对于HOOMD-Blue和Amber等应用程序,配有V100的服务器可以代替54台CPU服务器的对应性能>所有常用MD应用程序均支持GPU加速>支持主要数学库,例如FFT和BLAS>每个GPU的单精度浮点运算能力高达15.
7TFLOPS/s>每个GPU的带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/molecular_dynamics_cnTESLAV100性能指南分子动力学应用程序性能指南|分子动力学HOOMD-BLUE专为GPU编写的粒子动力学程序包版本2.
1.
6加速特性CPU和GPU版本可用可扩展性多GPU和多节点更多信息http://codeblue.
umich.
edu/hoomd-blue/index.
htmlAMBER一套模拟生物分子层面上分子动力学的程序版本16.
8加速特性PMEMD显式溶剂和GB;显式和隐式溶剂、REMD、aMD可扩展性多GPU和单节点更多信息http://ambermd.
org/gpus量子化学(QC)模拟是发现新药物和材料的关键,占用HPC数据中心工作负载的大部分.
目前,60%的常用QC应用程序已支持GPU加速.
数据中心配有TeslaV100GPU后,在运行QC应用程序时可节省高达30%的服务器和基础架构购买成本.
QC适用的TESLA平台和V100的主要特性>对于VASP等应用程序,配有V100的服务器可以代替多达5台CPU服务器的对应性能>60%的常用QC应用程序均支持GPU加速>支持主要数学库,例如FFT和BLAS>每个GPU的双精度浮点运算能力高达7.
8TFLOPS/s>适用于大型数据集的显存容量高达16GB如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/computational_chemistry_cnTESLAV100性能指南量子化学应用程序性能指南|量子化学VASP用于执行量子力学分子动力学(MD)从头计算模拟的程序包版本5.
4.
4加速特性RMM-DIIS、BlockedDavidson、K-points和精确交换可扩展性多GPU和多节点更多信息www.
nvidia.
com/vasp从聚变能到高能粒子,物理学模拟涵盖了HPC数据中心的各种应用程序.
许多常用物理学应用程序均已支持GPU加速,取得了之前不可能得到的宝贵见解.
>数据中心配有TeslaV100GPU后,运行GPU加速的物理学应用程序时可节省高达75%的服务器购买成本.
物理学适用的TESLA平台和V100的主要特性>对于GTC-P、QUDA和MILC等应用程序,配有V100的服务器可以代替>多达75台CPU服务器的对应性能>大多数常用物理学应用程序均支持GPU加速>双精度浮点运算能力高达7.
8TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cn(点击下拉菜单选择"物理学")TESLAV100性能指南物理学应用程序性能指南|物理学GTC-P用于优化等离子体物理学的开发代码版本2017加速特性推动、移动和碰撞可扩展性多GPU更多信息www.
nvidia.
com/gtc-pQUDA用于格点量子色动力学的GPU库版本2017加速特性全部可扩展性多GPU和多节点更多信息www.
nvidia.
com/quda应用程序性能指南|物理学MILC格点量子色动力学(LQCD)代码,用于模拟基本粒子如何通过"强相互作用"形成和束缚以生成更大的粒子(例如质子和中子)版本2017加速特性交错费米子、克里洛夫求解和链节增大可扩展性多GPU和多节点更多信息www.
nvidia.
com/milc地质科学模拟是发现石油和天然气以及执行地质建模的关键.
目前,许多常用地质科学应用程序均已支持GPU加速.
数据中心配有TeslaV100GPU后,在运行地球科学应用程序时可节省高达70%的服务器和基础架构购买成本.
地球科学适用的TESLA平台和V100的主要特性>对于RTM和SPECFEM3D等应用程序,配有V100的服务器可以代替>多达82台CPU服务器的对应性能>常用石油和天然气应用程序均支持GPU加速>单精度浮点运算能力高达15.
7TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cn(点击下拉菜单选择"石油天然气/地震")TESLAV100性能指南地球科学应用程序性能指南|地球科学RTM逆时偏移(RTM)建模是油气勘探地震数据处理工作流程中的关键组成部分版本2017加速特性批处理算法可扩展性多GPU和多节点SPECFEM3D模拟地震波传播版本7.
0.
0可扩展性多GPU和多节点更多信息https://geodynamics.
org/cig/software/specfem3d_globe工程模拟是通过建模流程、热传递和有限元分析等开发新产品的关键环节.
目前,许多常用工程应用程序均已支持GPU加速.
数据中心配有NVIDIATeslaV100GPU后,在运行工程应用程序时可节省高达20%的服务器和基础架构购买成本,以及高达50%的软件许可成本.
工程适用的TESLA平台和V100的主要特性>对于SIMULIAAbaqus和ANSYSFLUENT等应用程序,配有TeslaV100的服务器可以代替多达4台CPU服务器的对应性能>常用工程应用程序均支持GPU加速>显存容量高达16GB>显存带宽高达900GB/s>双精度浮点运算能力高达7.
8TFLOPS/sTESLAV100性能指南工程学应用程序性能指南|工程学SIMULIAABAQUS用于分析结构的模拟工具版本2017加速特性稀疏直接求解器AMSEigen求解器稳态动力学求解器可扩展性多GPU和多节点更多信息www.
nvidia.
com/simulia-abaqusANSYSFLUENT用于流体动力学模拟的通用软件版本18加速特性基于压力的耦合求解器和辐射热传递可扩展性多GPU和多节点更多信息www.
nvidia.
com/ansys-fluent基准测试提供了系统在一定生产规模下的表现的近似情况,有助于评估不同>系统的相对性能.
常用基准测试具有GPU加速版本,可以帮助您了解在数据>中心运行GPU的好处.
基准测试适用的TESLA平台和V100的主要特性>对于Cloverleaf、MiniFE、Linpack和HPCG等基准测试,配有TeslaV100的服务器可以代替多达67台CPU服务器的对应性能>常用基准测试均支持GPU加速>双精度浮点运算能力高达7.
8TFLOPS/s,显存容量高达16GB>显存带宽高达900GB/sTESLAV100性能指南HPC基准测试应用程序性能指南|HPC基准测试CLOVERLEAF基准测试–迷你应用流体动力学版本1.
3加速特性Lagrangian-Eulerian显式流体动力学迷你应用可扩展性多节点(MPI)更多信息http://uk-mac.
github.
io/CloverLeafMINIFE基准测试–迷你应用有限元分析版本0.
3加速特性全部可扩展性多GPU更多信息https://mantevo.
org/about/applications应用程序性能指南|HPC基准测试LINPACK基准测试–测量浮点运算能力版本2.
1加速特性全部可扩展性多节点和多节点更多信息www.
top500.
org/project/linpackHPCG基准测试–练习与各种重要HPC应用程序密切相符的计算和数据访问模式版本3加速特性全部可扩展性多GPU和多节点更多信息www.
hpcg-benchmark.
org/index.
html2017NVIDIACorporation.
保留所有权利.
NVIDIA、NVIDIA徽标和Tesla均为NVIDIACorporation在美国和其他国家/地区的商标和/或注册商标.
其他公司和产品名称可能是其各关联公司的商标.
2017年11月TESLAV100产品规格适用于PCIe服务器的NVIDIATeslaV100适用于经NVLink优化服务器的NVIDIATeslaV100双精度浮点运算能力高达7TFLOPS高达7.
8TFLOPS单精度浮点运算能力高达14TFLOPS高达15.
7TFLOPS深度学习高达112TFLOPS高达125TFLOPSNVIDIANVLink互联带宽-300GB/sPCIex16互联带宽32GB/s32GB/sCoWoSHBM2堆叠式显存容量16GB16GBCoWoSHBM2堆叠式显存带宽900GB/s900GB/s相关假设和免责声明常用应用程序中支持GPU加速的百分比数据来源于i360报告《HPCSupportforGPUComputing》(HPC对GPU计算的支持报告)中50大应用程序列表.
吞吐量和成本节约的相关计算数据,为应用程序在域中以相同的计算周期进行基准测试得到的假设工作负载概要:http://www.
intersect360.
com/industry/reports.
phpid=131匹配单个GPU节点所需的CPU节点数使用GPU节点应用程序加速的实验室性能结果和多CPU节点扩展性能进行计算.
例如,分子动力学应用程序HOOMD-Blue的GPU节点应用程序加速为37.
9倍.
将CPU节点扩展到8个节点集群时,总系统输出为7.
1倍.
因此,扩展系数为8除以7.
1(即1.
13).
要计算匹配单个GPU节点性能所需的CPU节点数,应将37.
9(GPU节点应用程序加速系数)乘以1.
13(CPU节点扩展系数),也就是需要43个节点.
国庆钜惠 最低5折起 限量促销CYUN专注海外精品服务器资源,主营香港CN2 GIA、美国CERA、美国高防服务器资源,实体公司,ISP/IDC资质齐全,客服配备齐全。本次针对国庆推出非常给力的促销活动,旗下所有平台同享,新老客户同享,限时限量,售完截止。活动截止时间:2021年10月9日官网地址:www.cyun.net参与机型:香港CN2 GIA云服务器、香港双程CN2云服...
Vultr 商家有新增韩国首尔机房,这个是继日本、新加坡之后的第三个亚洲机房。不过可以大概率知道肯定不是直连中国机房的,因为早期的日本机房有过直连后来取消的。今天准备体验看看VULTR VPS主机商的韩国首尔机房的云服务器的速度和性能。1、全球节点PING速度测试这里先通过PING测试工具看看全球几十个节点的PING速度。看到好像移动速度还不错。2、路由去程测试测试看看VULTR韩国首尔机房的节点...
6元虚拟主机是否值得购买?近期各商家都纷纷推出了优质便宜的虚拟主机产品,其中不少6元的虚拟主机,这种主机是否值得购买,下面我们一起来看看。1、百度云6元体验三个月(活动时间有限抓紧体验)体验地址:https://cloud.baidu.com/campaign/experience/index.html?from=bchPromotion20182、Ucloud 10元云主机体验地址:https:...
linpack为你推荐
sonicchat深圳哪里有卖汽车模型?留学生认证留学生回国认证,是否要求需要在国外待满三年,还是只需要完成所需的三年课程?商标注册流程及费用商标注册流程及费用?刘祚天还有DJ网么?地陷裂口造成地陷都有哪些原因?lunwenjiancepaperrater论文检测准确吗长尾关键词挖掘工具外贸长尾关键词挖掘工具哪个好用mole.61.com摩尔大陆?????www.zjs.com.cn中通快递投诉网站网址是什么?99nets.com99nets网游模拟娱乐社区怎么打不开了?????????谁能告诉我 ???、
成都虚拟空间 抗投诉vps主机 ftp空间 highfrequency 免费名片模板 日志分析软件 debian6 web服务器架设软件 免费全能空间 铁通流量查询 坐公交投2700元 国外代理服务器软件 可外链相册 vip购优惠 百度云1t 卡巴斯基免费试用 香港新世界中心 闪讯官网 登陆空间 韩国代理ip 更多