应用程序linpack
linpack 时间:2021-03-26 阅读:(
)
TESLAV100性能指南深度学习和HPC应用程序2017年11月应用程序性能指南TESLAV100性能指南现代高性能计算(HPC)数据中心是解决全球一些重大科学和工程挑战的关键.
NVIDIATesla加速计算平台让这些现代数据中心能够使用行业领先的应用>程序加速完成HPC和AI领域的工作.
TeslaV100GPU是现代数据中心的>引擎,能够以更少的服务器提供突破性性能,从而加快探索发现的步伐,>并大幅降低成本.
改进的性能和解决方案时间对提高收益和生产力也有显著的有利影响.
每个HPC数据中心都可从Tesla平台中受益.
多个领域超过500款HPC应用程序已经过GPU优化,其中包括全部15大常用HPC应用程序以及各主要的深度学习框架.
超过500款HPC应用程序和各主要深度学习框架已支持GPU加速.
>>要获取GPU加速应用程序的最新目录,请访问:www.
nvidia.
cn/object/gpu-applications-cn>>如要获取适用于各种加速应用程序的简单指令,以实现GPU上的快速启动和运行,请访问:>www.
nvidia.
com/gpu-ready-apps使用GPU加速应用程序的研究领域包括:深度学习分子动力学量子化学物理学地球科学工程学HPC基准测试深度学习正在解决几年前还看似遥不可及的科学、企业级的和消费者层面的>重要问题.
各主要深度学习框架均支持NVIDIAGPU优化,从而使数据科学家和研究人员可以在工作中利用人工智能.
数据中心配有TeslaV100GPU后,在运行深度学习训练和推理框架时可节省高达85%的服务器和基础架构购置>成本.
深度学习训练适用的TESLA平台和V100的主要特性>借助TeslaV100,Caffe、TensorFlow和CNTK的速度可提升至高达3倍(与P100相比)>所有常用深度学习框架均支持GPU加速>TensorFlow运算能力高达125TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cnTESLAV100性能指南深度学习应用程序性能指南|深度学习CAFFE加州大学伯克利分校开发的一种热门GPU加速深度学习框架版本1.
0加速特性全框架加速可扩展性多GPU更多信息caffe.
berkeleyvision.
org应用程序性能指南|深度学习分子动力学(MD)代表HPC数据中心的大部分工作负载.
所有常用MD应用程序均已支持GPU加速,科学家们先前无法借助这些应用程序的传统>纯CPU版本执行的模拟,现在都可运行.
数据中心配有TeslaV100GPU后,>在运行MD应用程序时可节省高达80%的服务器和基础架构购买成本.
MD适用的TESLA平台和V100的主要特性>对于HOOMD-Blue和Amber等应用程序,配有V100的服务器可以代替54台CPU服务器的对应性能>所有常用MD应用程序均支持GPU加速>支持主要数学库,例如FFT和BLAS>每个GPU的单精度浮点运算能力高达15.
7TFLOPS/s>每个GPU的带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/molecular_dynamics_cnTESLAV100性能指南分子动力学应用程序性能指南|分子动力学HOOMD-BLUE专为GPU编写的粒子动力学程序包版本2.
1.
6加速特性CPU和GPU版本可用可扩展性多GPU和多节点更多信息http://codeblue.
umich.
edu/hoomd-blue/index.
htmlAMBER一套模拟生物分子层面上分子动力学的程序版本16.
8加速特性PMEMD显式溶剂和GB;显式和隐式溶剂、REMD、aMD可扩展性多GPU和单节点更多信息http://ambermd.
org/gpus量子化学(QC)模拟是发现新药物和材料的关键,占用HPC数据中心工作负载的大部分.
目前,60%的常用QC应用程序已支持GPU加速.
数据中心配有TeslaV100GPU后,在运行QC应用程序时可节省高达30%的服务器和基础架构购买成本.
QC适用的TESLA平台和V100的主要特性>对于VASP等应用程序,配有V100的服务器可以代替多达5台CPU服务器的对应性能>60%的常用QC应用程序均支持GPU加速>支持主要数学库,例如FFT和BLAS>每个GPU的双精度浮点运算能力高达7.
8TFLOPS/s>适用于大型数据集的显存容量高达16GB如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/computational_chemistry_cnTESLAV100性能指南量子化学应用程序性能指南|量子化学VASP用于执行量子力学分子动力学(MD)从头计算模拟的程序包版本5.
4.
4加速特性RMM-DIIS、BlockedDavidson、K-points和精确交换可扩展性多GPU和多节点更多信息www.
nvidia.
com/vasp从聚变能到高能粒子,物理学模拟涵盖了HPC数据中心的各种应用程序.
许多常用物理学应用程序均已支持GPU加速,取得了之前不可能得到的宝贵见解.
>数据中心配有TeslaV100GPU后,运行GPU加速的物理学应用程序时可节省高达75%的服务器购买成本.
物理学适用的TESLA平台和V100的主要特性>对于GTC-P、QUDA和MILC等应用程序,配有V100的服务器可以代替>多达75台CPU服务器的对应性能>大多数常用物理学应用程序均支持GPU加速>双精度浮点运算能力高达7.
8TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cn(点击下拉菜单选择"物理学")TESLAV100性能指南物理学应用程序性能指南|物理学GTC-P用于优化等离子体物理学的开发代码版本2017加速特性推动、移动和碰撞可扩展性多GPU更多信息www.
nvidia.
com/gtc-pQUDA用于格点量子色动力学的GPU库版本2017加速特性全部可扩展性多GPU和多节点更多信息www.
nvidia.
com/quda应用程序性能指南|物理学MILC格点量子色动力学(LQCD)代码,用于模拟基本粒子如何通过"强相互作用"形成和束缚以生成更大的粒子(例如质子和中子)版本2017加速特性交错费米子、克里洛夫求解和链节增大可扩展性多GPU和多节点更多信息www.
nvidia.
com/milc地质科学模拟是发现石油和天然气以及执行地质建模的关键.
目前,许多常用地质科学应用程序均已支持GPU加速.
数据中心配有TeslaV100GPU后,在运行地球科学应用程序时可节省高达70%的服务器和基础架构购买成本.
地球科学适用的TESLA平台和V100的主要特性>对于RTM和SPECFEM3D等应用程序,配有V100的服务器可以代替>多达82台CPU服务器的对应性能>常用石油和天然气应用程序均支持GPU加速>单精度浮点运算能力高达15.
7TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cn(点击下拉菜单选择"石油天然气/地震")TESLAV100性能指南地球科学应用程序性能指南|地球科学RTM逆时偏移(RTM)建模是油气勘探地震数据处理工作流程中的关键组成部分版本2017加速特性批处理算法可扩展性多GPU和多节点SPECFEM3D模拟地震波传播版本7.
0.
0可扩展性多GPU和多节点更多信息https://geodynamics.
org/cig/software/specfem3d_globe工程模拟是通过建模流程、热传递和有限元分析等开发新产品的关键环节.
目前,许多常用工程应用程序均已支持GPU加速.
数据中心配有NVIDIATeslaV100GPU后,在运行工程应用程序时可节省高达20%的服务器和基础架构购买成本,以及高达50%的软件许可成本.
工程适用的TESLA平台和V100的主要特性>对于SIMULIAAbaqus和ANSYSFLUENT等应用程序,配有TeslaV100的服务器可以代替多达4台CPU服务器的对应性能>常用工程应用程序均支持GPU加速>显存容量高达16GB>显存带宽高达900GB/s>双精度浮点运算能力高达7.
8TFLOPS/sTESLAV100性能指南工程学应用程序性能指南|工程学SIMULIAABAQUS用于分析结构的模拟工具版本2017加速特性稀疏直接求解器AMSEigen求解器稳态动力学求解器可扩展性多GPU和多节点更多信息www.
nvidia.
com/simulia-abaqusANSYSFLUENT用于流体动力学模拟的通用软件版本18加速特性基于压力的耦合求解器和辐射热传递可扩展性多GPU和多节点更多信息www.
nvidia.
com/ansys-fluent基准测试提供了系统在一定生产规模下的表现的近似情况,有助于评估不同>系统的相对性能.
常用基准测试具有GPU加速版本,可以帮助您了解在数据>中心运行GPU的好处.
基准测试适用的TESLA平台和V100的主要特性>对于Cloverleaf、MiniFE、Linpack和HPCG等基准测试,配有TeslaV100的服务器可以代替多达67台CPU服务器的对应性能>常用基准测试均支持GPU加速>双精度浮点运算能力高达7.
8TFLOPS/s,显存容量高达16GB>显存带宽高达900GB/sTESLAV100性能指南HPC基准测试应用程序性能指南|HPC基准测试CLOVERLEAF基准测试–迷你应用流体动力学版本1.
3加速特性Lagrangian-Eulerian显式流体动力学迷你应用可扩展性多节点(MPI)更多信息http://uk-mac.
github.
io/CloverLeafMINIFE基准测试–迷你应用有限元分析版本0.
3加速特性全部可扩展性多GPU更多信息https://mantevo.
org/about/applications应用程序性能指南|HPC基准测试LINPACK基准测试–测量浮点运算能力版本2.
1加速特性全部可扩展性多节点和多节点更多信息www.
top500.
org/project/linpackHPCG基准测试–练习与各种重要HPC应用程序密切相符的计算和数据访问模式版本3加速特性全部可扩展性多GPU和多节点更多信息www.
hpcg-benchmark.
org/index.
html2017NVIDIACorporation.
保留所有权利.
NVIDIA、NVIDIA徽标和Tesla均为NVIDIACorporation在美国和其他国家/地区的商标和/或注册商标.
其他公司和产品名称可能是其各关联公司的商标.
2017年11月TESLAV100产品规格适用于PCIe服务器的NVIDIATeslaV100适用于经NVLink优化服务器的NVIDIATeslaV100双精度浮点运算能力高达7TFLOPS高达7.
8TFLOPS单精度浮点运算能力高达14TFLOPS高达15.
7TFLOPS深度学习高达112TFLOPS高达125TFLOPSNVIDIANVLink互联带宽-300GB/sPCIex16互联带宽32GB/s32GB/sCoWoSHBM2堆叠式显存容量16GB16GBCoWoSHBM2堆叠式显存带宽900GB/s900GB/s相关假设和免责声明常用应用程序中支持GPU加速的百分比数据来源于i360报告《HPCSupportforGPUComputing》(HPC对GPU计算的支持报告)中50大应用程序列表.
吞吐量和成本节约的相关计算数据,为应用程序在域中以相同的计算周期进行基准测试得到的假设工作负载概要:http://www.
intersect360.
com/industry/reports.
phpid=131匹配单个GPU节点所需的CPU节点数使用GPU节点应用程序加速的实验室性能结果和多CPU节点扩展性能进行计算.
例如,分子动力学应用程序HOOMD-Blue的GPU节点应用程序加速为37.
9倍.
将CPU节点扩展到8个节点集群时,总系统输出为7.
1倍.
因此,扩展系数为8除以7.
1(即1.
13).
要计算匹配单个GPU节点性能所需的CPU节点数,应将37.
9(GPU节点应用程序加速系数)乘以1.
13(CPU节点扩展系数),也就是需要43个节点.
进入6月,各大网络平台都开启了618促销,腾讯云目前也正在开展618云上Go活动,上海/北京/广州/成都/香港/新加坡/硅谷等多个地区云服务器及轻量服务器秒杀,最低年付95元起,参与活动的产品还包括短信包、CDN流量包、MySQL数据库、云存储(标准存储)、直播/点播流量包等等,本轮秒杀活动每天5场,一直持续到7月中旬,感兴趣的朋友可以关注本页。活动页面:https://cloud.tencent...
Contabo自4月份在新加坡增设数据中心以后,这才短短的过去不到3个月,现在同时新增了美国纽约和西雅图数据中心。可见Contabo加速了全球布局,目前可选的数据中心包括:德国本土、美国东部(纽约)、美国西部(西雅图)、美国中部(圣路易斯)和亚洲的新加坡数据中心。为了庆祝美国独立日和新增数据中心,自7月4日开始,购买美国地区的VPS、VDS和独立服务器均免设置费。Contabo是德国的老牌服务商,...
农历春节将至,腾讯云开启了热门爆款云产品首单特惠秒杀活动,上海/北京/广州1核2G云服务器首年仅38元起,上架了新的首单优惠活动,每天三场秒杀,长期有效,其中轻量应用服务器2G内存5M带宽仅需年费38元起,其他产品比如CDN流量包、短信包、MySQL、直播流量包、标准存储等等产品也参与活动,腾讯云官网已注册且完成实名认证的国内站用户均可参与。活动页面:https://cloud.tencent.c...
linpack为你推荐
Baby被问婚变绯闻黄晓明baby一起出来带娃,想要打破离婚传闻?网红名字被抢注谁知道这个网红叫什么名字?求帮助!蓝色骨头手机宠物的骨头分别代表几级?www.hhh258comwww.tx88d.com 有这个网站吗?百度指数词什么是百度指数百度指数词百度指数是指,词不管通过什么样的搜索引擎进行搜索,都会被算成百度指数吗?m88.comwww.m88.com现在的官方网址是哪个啊 ?www.m88.com怎么样?广告法中国的广告法有哪些。www.ijinshan.com在电脑看港台电视台那个网站最好而又不用钱速度又快baqizi.cc孔融弑母是真的吗?
国际域名抢注 adman 256m内存 正版win8.1升级win10 好玩的桌面 七夕快乐英文 idc是什么 双十一秒杀 东莞服务器 starry lamp什么意思 lamp兄弟连 阿里云手机官网 实惠 可外链的相册 apnic googlevoice 石家庄服务器 新网dns godaddyssl 更多