浪潮物理基础设施管理平台(ISPIM)
浪潮服务器 时间:2021-03-27 阅读:(
)
技术白皮书文档版本V1.
1发布日期2020-10-31浪潮物理基础设施管理平台(ISPIM)技术白皮书I版权所有浪潮电子信息产业股份有限公司尊敬的用户:版权浪潮2017.
版权所有未经事先书面同意,本文档的任何部分不得复制或以任何形式或任何方式修改、外传注:您购买的产品、服务或特性等应受浪潮集团商业合同和条款的约束.
本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内.
除非合同另有约定,浪潮集团对本文档内容不做任何明示或默示的声明或保证.
由于产品版本升级或其他原因,本文档内容会不定期进行更新.
除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保.
浪潮保留本软件的所有权和所有相关的知识产权,获得、使用本软件的任何主体,均应依照法律法规之规定、依照合法协议之约定,尊重并保护浪潮及相关权利人对本软件及相关知识产权的权利,该尊重和保护应不低于浪潮对其他权利人所负担之义务.
Inspur和"浪潮"是浪潮集团的注册商标.
Windows是微软公司的注册商标.
Intel、Xeon是Intel公司的注册商标.
其他商标分别属于其相应的注册公司.
技术服务电话:4008600011地址:中国济南市浪潮路1036号浪潮电子信息产业股份有限公司邮编:250101浪潮物理基础设施管理平台(ISPIM)技术白皮书II版权所有浪潮电子信息产业股份有限公司前言本文档主要介绍了ISPIM软件的功能,应用场景及其操作指导.
读者对象本文档主要适用于以下工程师:技术支持工程师维护工程师符号约定在文中可能出现以下标志,所代表的含义如下:符号说明用于警示紧急的危险情形,若不避免,将会导致人员死亡或严重的人身伤害,或者严重的服务器损毁用于警示潜在的危险情形,若不避免,可能会导致人员死亡或严重的人身伤害,或者服务器损毁用于警示潜在的危险情形,若不避免,可能会导致中度或轻微的人身伤害,或者服务器故障用于传递设备或环境安全警示信息,若不避免,可能会导致设备损坏、数据丢失、设备性能降低或其它不可预知的结果,"注意"不涉及人身伤害用于突出重要/关键信息、最佳实践和小窍门等,"说明"不是安全警示信息,不涉及人身、设备及环境伤害浪潮物理基础设施管理平台(ISPIM)技术白皮书III版权所有浪潮电子信息产业股份有限公司修改记录文档版本发布日期修改说明V1.
12020-10-31新增"边缘盒子"、"一体机"、"安全设备"等相关内容新增浪潮服务器全生命周期固件变更、故障状态追溯新增物理链路自动拓扑、支持手动自定义网络拓扑新增带内秒级性能监控及高性能HPC集群监控新增服务器宕机、部件故障后的根因定位及修复建议支持分布式数据分析框架,支持横向平滑扩展优化其他功能描述更新部分规格V1.
02020-03-30第一次正式发布浪潮物理基础设施管理平台(ISPIM)技术白皮书IV版权所有浪潮电子信息产业股份有限公司目录前言.
II读者对象.
II符号约定.
II修改记录.
III目录.
IV1文档指南.
12产品简介.
22.
1产品定位.
22.
2关键技术特性33系统架构.
43.
1软件架构.
43.
2上下文对接方式54功能特性.
74.
1快速灵活的纳管方式74.
1.
1全网设备纳管.
74.
1.
2SR机柜纳管.
74.
1.
3一体机纳管.
84.
1.
4刀箱纳管.
84.
1.
5边缘盒子纳管.
84.
1.
6网络设备纳管.
84.
1.
7安全设备纳管.
84.
1.
8存储纳管.
84.
2智能资产管理94.
2.
1用户场景问题.
94.
2.
2方案介绍.
94.
2.
3特性介绍.
104.
3设备全方位监控124.
3.
1设备信息及告警多维度呈现.
144.
3.
2设备告警管理.
17浪潮物理基础设施管理平台(ISPIM)技术白皮书V版权所有浪潮电子信息产业股份有限公司4.
3.
3设备性能监控.
174.
3.
4设备故障诊断.
184.
3.
5智能告警对接.
194.
4智能的能耗管理204.
4.
1用户场景问题.
204.
4.
2功耗性能历史曲线.
214.
4.
3功耗策略.
214.
4.
4能耗优化.
224.
5高效的无状态管理244.
5.
1标准化的基线管理.
254.
5.
2高效快捷的固件管理.
264.
5.
3简便易用的部署管理.
304.
5.
4统一的镜像文件管理.
314.
6可视化拓扑管理324.
6.
13D拓扑.
324.
6.
2网络拓扑.
324.
7智能容灾分布式管理344.
7.
1采集器.
354.
7.
2分析器.
354.
7.
3负载均衡器.
354.
8至关重要的安全管理354.
8.
1用户管理.
354.
8.
2鉴权管理.
364.
8.
3安全配置.
364.
8.
4证书管理.
364.
9标准的北向接口374.
9.
1用户场景问题.
374.
9.
2方案介绍.
374.
9.
3客户价值.
385部署方案.
385.
1部署方式.
385.
1.
1单节点部署.
38浪潮物理基础设施管理平台(ISPIM)技术白皮书VI版权所有浪潮电子信息产业股份有限公司5.
1.
2高可用部署.
385.
1.
3采集分析集群部署.
395.
2升级方式.
396安全性.
406.
1组网约束.
406.
2系统安全.
426.
3应用安全.
427可靠性.
447.
1集群可靠性447.
2数据可靠性448配置要求.
45A如何获取帮助.
46A.
1收集必要的故障信息.
46A.
2如何使用文档.
46A.
3获取技术支持.
46B术语和缩略语.
47浪潮物理基础设施管理平台(ISPIM)技术白皮书1版权所有浪潮电子信息产业股份有限公司1文档指南本章节主要介绍ISPIM产品相关文档及内容说明.
表1-1文档指南类型文档名称内容介绍手册获取了解产品技术白皮书描述ISPIM的产品定位,技术架构及各项规格参数.
《浪潮物理基础设施管理平台(ISPIM)V6.
0.
0白皮书》安装与测试部署手册描述ISPIM的安装操作、初始化配置,并给出常用操作和故障处理方法.
《浪潮物理基础设施管理平台(ISPIM)V6.
0.
0部署手册》操作类用户手册描述ISPIM的功能特性和操作指导.
《浪潮物理基础设施管理平台(ISPIM)V6.
0.
0用户手册》浪潮物理基础设施管理平台(ISPIM)技术白皮书2版权所有浪潮电子信息产业股份有限公司2产品简介2.
1产品定位浪潮物理基础设施管理平台(InspurPhysicalInfrastructureManager,简称ISPIM),是根据市场需求,遵循NFV标准,自主研发的一款高可用、高性能、高可扩展、高可维护的行业数据中心物理基础设施管理平台.
ISPIM定位为行业数据中心运维管理软件,是新一代数据中心物理基础设施的全生命周期运维管理平台.
该平台覆盖市面全品牌IT设备,具备资源管理、故障监控、性能监控、能耗管理、报表统计、拓扑展示、服务器故障诊断、自动报修、固件升级/配置、OS部署等功能.
可实现服务器、存储、网络设备、安全设备的统一管理,真正促进了数据中心智能化管理,为客户打造无人值守数据中心,有效地帮助企业提高运维效率、降低运维成本,保障数据中心安全、可靠、稳定的运行.
ISPIM可广泛应用于公有云、私有云、数据中心、运营商和企业客户,在AI、HPC、互联网、智慧城市等多场景下部署,同时提供Restful、SNMP等接口,便于用户集成与对接.
图2-1ISPIM所在位置浪潮物理基础设施管理平台(ISPIM)技术白皮书3版权所有浪潮电子信息产业股份有限公司2.
2关键技术特性多场景轻量化部署,全生命周期管理ISPIM提供多种场景部署能力,从多类型虚机(KVM/VMware)到裸机场景部署,满足小型企业、大中型企业对于全网设备特别是服务器全生命周期管理的要求.
具备高可靠能力,1-N的数据采集、分析节点按需扩展ISPIM在应对多种场景下,提供高可靠能力,并具备采集、分析节点数从1到N的平滑扩展能力,以应对用户扩容及多数据中心的场景且不影响原有监控业务.
智能资产管理功能,资产变更实时跟踪ISPIM的资产管理方案通过全自动、端到端的资产管理,从设备上架、位置识别、配置核查、资产位置变更、部件变更、设备下架,实现了资产全生命周期的变更追溯.
全方位监控,把控业务全局ISPIM提供全网设备硬件状态监控、性能指标实时监控的能力.
帮助运维人员快速发现故障并及时处理故障.
智能故障诊断,缩短维修周期ISPIM基于浪潮故障专家库,打通浪潮360°专家服务,实现了浪潮服务器智能故障诊断、故障根因定位、专家维修建议,设备自动报修等功能.
秒级性能监控,掌握设备实时状况ISPIM对接Teye系统实现实时的性能采集,可实时接收设备运行性能指标,并凭借自研性能分析核心组件,可支撑上万台服务器同时进行秒级性能数据的监控与告警,帮助运维人员实时掌握设备的性能状况.
批量化升级、配置与部署,缩短上线周期ISPIM提供了批量固件升级、硬件配置、系统部署的能力,提升服务器上线运维效率.
浪潮物理基础设施管理平台(ISPIM)技术白皮书4版权所有浪潮电子信息产业股份有限公司版本管理,提升版本管理效率ISPIM提供固件及OS镜像本地管理与远程官网自动同步的能力,提升数据中心设备软硬件版本管理效率.
标准化的北向接口,方便用户集成对接ISPIM提供标准Redfish、SNMP接口,在此基础上可扩展其他功能,便于用户集成对接.
3系统架构3.
1软件架构图3-1ISPIM软件架构集中管理调度中心基础特性:监控、告警、升级、安全、DFX等.
五大功能:资产管理、故障管理、能耗管理、无状态管理、拓扑管理.
支持全网设备管理浪潮物理基础设施管理平台(ISPIM)技术白皮书5版权所有浪潮电子信息产业股份有限公司浪潮全系列产品,包括通用机架服务器、AI服务器、刀片服务器、春晓服务器、边缘设备、一体机及其它高端服务器产品,详细型号请参见《ISPIM规格清单》.
支持存储、网络设备、安全设备等多种设备混合管理.
高可用、高扩展能力主控节点HA主/备高可用.
分布式架构,提供水平在线扩展能力.
"探针式"采集,多数据中心统一管理.
管理规模从百台、千台、万台灵活支持.
图3-2ISPIM技术架构3.
2上下文对接方式服务器南向对接BMC与Teye,接口为IPMI、SNMP、Redfish等.
浪潮物理基础设施管理平台(ISPIM)技术白皮书6版权所有浪潮电子信息产业股份有限公司存储南向对接管理Controller,接口为SNMP、SMI-S.
网络设备、安全设备南向对接远程管理口,接口为SNMP.
北向接口对接上一级管理软件、第三方管理系统.
提供WebGUI,面向运维管理员.
图3-3ISPIM上下文对接图浪潮物理基础设施管理平台(ISPIM)技术白皮书74功能特性ISPIM(InspurPhysicalInfrastructureManager)是面向互联网、金融、通信、等行业数据中心的一体化的硬件运维监控平台,实现服务器、存储、网络设备统一智能监控运维.
图4-1ISPIM功能特性4.
1快速灵活的纳管方式ISPIM支持批量导入、自动发现等多种纳管方式,以满足各种业务诉求.
批量导入方式:适用于设备已经配置好管理IP,且认证信息已知的情况下的精准纳管,一次支持导入1000+台设备.
自动发现方式:强大的跨网段、跨域发现设备,精准纳管多数据中心设备.
4.
1.
1全网设备纳管ISPIM支持物理设备资源的集中管理,支持批量导入、自动发现两种纳管方式.
纳管范围包括:服务器(浪潮、华为、中兴、惠普、戴尔、H3C、曙光等)、存储、网络设备、SR机柜、一体机、安全设备等,详细列表请参见《ISPIM规格清单》.
4.
1.
2SR机柜纳管ISPIM支持对SR整机柜的集中管理,节点管理协议支持IPMI、SNMP、Redfish、RMC,浪潮物理基础设施管理平台(ISPIM)技术白皮书8SSH管理协议支持IPMI、CLI、SNMP.
4.
1.
3一体机纳管ISPIM支持对浪潮一体机扫描纳管,纳管协议协议支持http和https,实现对一体机内部服务器、交换机、存储设备的管理,同时支持对一体机环境温湿度、烟感等传感器的检测.
纳管一体机前,需要先在一体机"平板盒子"部署ISPIM-XX-SR-A1管理平台.
4.
1.
4刀箱纳管ISPIM支持通过刀箱CMC自动扫描获取刀片BMC信息,通过刀片BMC实现对刀片节点的统一管理.
4.
1.
5边缘盒子纳管ISPIM支持对浪潮边缘盒子进行集中管理,采用http协议.
在纳管边缘盒子前,需要先在边缘设备上部署好边缘管理系统,设定好边缘系统IP及用户名和密码,通过人工或者自动的方式在ISPIM端进行http扫描,实现对边缘盒子的纳管.
4.
1.
6网络设备纳管ISPIM支持对交换机、路由器、SDN等设备的管理,其中对交换机、路由的纳管支持SNMP协议,对SDN的纳管支持http协议,具体型号详细列表请参见《ISPIM规格清单》.
4.
1.
7安全设备纳管ISPIM支持对防火墙、IDS、IPS等设备的管理,支持SNMP协议,具体型号详细列表请参见《ISPIM规格清单》.
4.
1.
8存储纳管ISPIM支持对浪潮的通用磁阵产品、分布式存储,及其它厂商的存储设备进行集中管理,浪潮物理基础设施管理平台(ISPIM)技术白皮书9管理协议为RESTful接口,SNMP协议以及SMI-S协议,具体型号详细列表请参见《ISPIM规格清单》.
4.
2智能资产管理ISPIM通过机柜级的RMC,能够自动获取机柜设备的物理位置与资产信息.
ISPIM支持第三方设备的资产管理,针对浪潮服务器可以实现部件级的资产管理.
4.
2.
1用户场景问题随着IT设备需求的增长,数据中心设备规模越来越大.
面对数据中心大量的资产,传统IT资产管理系统不仅耗时耗力,而且变更流程长、效率低下.
传统资产管理的典型的问题如下:人工维护效率低下:设备入库和上线操作需要手动录入,效率低下.
设备规格查验困难:对于最新采购的设备,无法确定是否与订单规格一致.
设备变更风险:设备变更需要人工管理,无法自动跟踪.
一旦人工操作出现偏差,无法立刻发现,存在遗失风险.
安全风险:设备的关键部件可能被人为更换,数据存在恶意获取或者破坏风险.
数据中心规划困难:对数据中心的空间缺乏直观的呈现,新增设备难以规划空间.
资产盘点困难:每次资产盘点都需要花费大量的人力和时间,效率低下.
以上是IT资产管理中的常见问题,解决这个问题的关键点在于实现资产与CMDB的自动同步,避免人工干预.
4.
2.
2方案介绍ISPIM实现了全自动的资产端到端管理,从设备上线、位置识别、配置核查、资产位置变更、部件变更、机柜空间管理,到跟客户CMDB的整合,都提供的完善的解决方案.
图4-2资产管理解决方案浪潮物理基础设施管理平台(ISPIM)技术白皮书10ISPIM配合SR智能机柜、智能刀箱管理套件实现了设备自动发现和位置识别.
机柜RMC或CMC系统通过内部直连获取节点U位信息,节点SN、型号、MAC地址、IP地址、CPU、内存信息.
RMC作为机柜的智能控制系统,提供基于工业标准的Redfish管理协议,实时监控机柜设备的变更,并将所有的资产和位置信息通过Redfish标准接口同步到ISPIM.
RMC系统记录了机柜的物理位置信息,ISPIM会主动抓取RMC整合后的资产信息.
ISPIM通过服务器的BMC,能够主动同步部件的变化,从而实现了部件级的资产管理.
典型场景包括:硬盘和内存的插拔与更换事件.
ISPIM支持北向的Redfish管理接口,可以对接第三方的CMDB和资产管理系统.
ISPIM支持主动上报变更事件,实现实时的资产变化跟踪.
4.
2.
3特性介绍ISPIM部件级的资产管理,实现资产管理自动化与可视化,管理效率大幅提升.
特性包括:资产自动扫描、秒级盘点,资产信息全景多维度展示.
部件级资产管理,数据中心资产组件信息一目了然,支持报表导出.
同时实时追踪资产变更,可查可控,对资产利用情况进行分析,提升资产利用率.
数据中心3D可视化管理,多维度呈现数据中心资产分布,温度,能耗,告警信息.
机柜位置、设备槽位、部件状态信息一目了然.
ISPIM提供REST接口,支持与第三方CMDB对接,便于资产管理系统集成.
浪潮物理基础设施管理平台(ISPIM)技术白皮书11资产全景统计ISPIM支持按数据中心维度的资产全景统计,包括:服务器、存储、网络、刀箱、机柜等设备的统计.
数据中心资产总数和空间使用率.
资产明细展示ISPIM支持以设备和部件维度展示详细的统计信息,包括:按照服务器、存储、网络、刀箱、机柜、防火墙维度分类展示设备的不同型号统计.
展示设备的名称、序列号、IP、位置、厂商、型号、占用空间、上架时间.
展示服务器设备的硬盘、内存、CPU、主板等部件数量统计.
展示详细部件的名称、类型、厂商、型号、序列号等信息.
服务器全生命周期管理ISPIM对数据中心IT基础设施进行监测、管理运营,为硬件设备提供全生命周期管理.
从服务器上架至下架整个生命周期,支持记录设备和部件的详细变更事件,包含设备上架、下架、部件增加、部件删除、部件状态变化、固件版本更新等,支持按照数据中心分类展示变更、详细的变更事件信息.
变更事件记录了变更时间、变更类型、设备型号、序列号、资产类型、位置及详细的资产变更描述.
通过资产变更记录,用户可以直观地看出每个阶段设备的变化趋势,发现设备和部件存在的潜在风险.
同时支持以文件的形式存储变更信息,为服务器部件故障分析提供有效数据源.
ISPIM资产全生命周期管理:提供了有效、准确、及时的"部件级"IT资产信息.
系统支持自动采集设备的硬件配置信息,有效的解决人工录入信息准确性得不到保证的问题.
资产数据定时自动更新,解决了资产信息不能及时同步的问题.
自动采集的"部件级"资产数据,实现了设备"配置"变更记录,确保每一次变更自动记录系统中,且记录不可修改、删除,实现资产变更的可审计、可追踪.
浪潮物理基础设施管理平台(ISPIM)技术白皮书12图4-33D机房机柜视图ISPIM对机柜展示的内容包括:机柜基本信息:包括机柜位置、编号、尺寸、高度.
智能资产管理RMC的基本IP、型号和版本信息.
机柜2D视图:支持展示设备的详细信息,包括型号尺寸、高度、自身告警、节点告警.
机柜设备列表:包含设备名称、类型、型号、厂商、U位、序列号、告警状态.
通过机柜视图,客户可以直观看到所查看的机柜的布局,功耗及气流分布,便于用户对机柜的空间、节点健康状态有一个直观的认识,从而进一步规划机柜的使用情况.
对接第三方CMDBISPIM提供了完善的资产信息展示与资产操作界面,同时对外提供RESTful接口,能够对接第三方CMDB,便于与客户的资产管理系统对接.
4.
3设备全方位监控ISPIM通过多种标准管理协议,以主被动结合的方式,提供设备全天候实时监控与故障浪潮物理基础设施管理平台(ISPIM)技术白皮书13分析,减少业务隐患.
特性包括:全天候主动巡检+被动接收.
实时发现告警.
-主动轮询支持数据采集频率设置与采集项的自定义,结合用户实际关注点,进行实时精准采集,提升监控效率.
-被动接收支持TrapOID集中管理,接收解析设置及南向转发.
确保设备的告警推送能够被准确解析,没有遗漏.
支持万余设备带内网络秒级性能监控.
-ISPIM可搭配带内Agent软件-浪潮管理驱动软件Teye,实现对设备带内性能指标的秒级实时采集及历史汇聚.
实现更实时、动态的设备性能采集与监控.
-支持采集器、分析器与存储数据库的水平扩容与负载均衡,保障万余设备的稳定监控.
带内+带外部件状态、性能指标、维保、网络状态等全方位监控.
-带外监控的同时,提供可选的带内Agent软件-浪潮管理驱动软件Teye,实现对设备性能数据的采集.
实现更全面的设备信息采集与监控.
-支持维保到期告警,满足维保需求.
告警规则、屏蔽规则、重定义规则、通知规则等模板灵活定义告警.
-支持数据采集项与告警阈值的自定义.
-支持屏蔽规则的一键创建.
规则涵盖屏蔽源,按告警位置屏蔽,按具体告警屏蔽等多种自定义规则,实现屏蔽粒度的自定义.
-支持通知规则的自定义.
内容涵盖:通知时间,通知方式,告警类型,联系人.
支持通知内容格式的自定义.
-支持告警名称及告警级别的重定义.
内容涵盖:所有告警类型的名称自定义及针对特定资源的级别自定义.
邮件、短信、第三方平台等多方式告警提醒.
图4-4ISPIM全方位设备监控浪潮物理基础设施管理平台(ISPIM)技术白皮书144.
3.
1设备信息及告警多维度呈现ISPIM将数据中心和设备监控信息按照不同视图的方式进行组织,通过不同视图能够更准确快捷地找到客户关注的内容.
数据中心3D视图展示:支持按照数据中心、机房、机柜维度查看资源的监控及状态信息.
硬件设备信息展示:支持按照设备所属类型进行查看.
告警信息统计:支持不同维度的告警信息展示.
表4-1多维度告警呈现维度描述服务器告警统计按照不同的告警级别,呈现服务器告警的数量分布告警分类统计按照不同的告警类型,呈现设备告警的数量分布部件告警数量统计显示所有资产部件的告警数量分布设备类别告警数量统计按照不同的设备类别,呈现告警的数量分布及级别比例设备信息展示ISPIM支持对已接入的服务器设备部件信息进行360度呈现和管理:统一Portle-提供视图的定制功能,跟据用户角色自定义视图,展现关键设备告警、资源状态统计等信息.
-支持首页定制化、实时呈现最新的业务状态,帮助用户快速锁定关键业务指标.
可视化大屏:支持屏幕分辨率定制,适应各种大屏幕监控需求.
服务器部件信息浪潮物理基础设施管理平台(ISPIM)技术白皮书15-电源信息:名称、状态、槽位、型号、模式等.
-风扇信息:名称、状态、槽位、转速百分比、模式、转速、槽位等.
-处理器信息:名称、厂商、型号、主频、槽位、核数/线程数、一级缓存、二级缓存、三级缓存等.
-内存信息:名称、厂商、容量、序列号、类型、状态和频率、槽位等.
-物理磁盘:名称、设备ID、槽位、容量、接口类型、固件状态等.
-逻辑磁盘:设备ID、名称、容量、状态等.
-网络信息:其中BMC适配器(名称、MAC地址、IP等信息);系统网络适配器(在位状态、位置、厂商、型号、端口、端口状态、端口MAC地址等信息).
-RAID卡:名称、序列号号、资源归属、固件版本、状态、型号、厂商ID等.
-逻辑磁盘:名称、状态、容量.
-PCIE卡:名称、状态、厂商、槽位、描述等.
交换机部件信息-单板:端口、风扇、电源等.
-端口:名称、描述、速率、类型、状态、所连设备IP、VLAN、绑定的MAC、所连设备MAC、对端端口唯一标识等.
-风扇:名称、状态等.
-电源:名称、型号、模式、状态等.
存储部件信息-BBU:名称、状态等.
-控制器:名称、容量、状态等.
-风扇:名称、状态等.
-ISCSI:名称、ID、索引、速率、状态、IP、MAC、子网掩码等.
-LUN:名称、WWN、LUNID、块大小、块数量、未使用的快数、总容量、未用容量、状态等.
-电源:名称、状态等.
-RAID:名称、池ID、总容量、已用容量、未用容量、状态等-磁盘:ID、名称、型号、厂商、微码版本、容量、状态、块大小、块数量、类型、槽位等.
-FC:端口索引、端口ID、端口速率、端口类型、状态等.
浪潮物理基础设施管理平台(ISPIM)技术白皮书16分布式存储信息-集群信息:名称、型号、厂商、软件版本、资源重构间隔、卷清理间隔、自动精简配置、运行状态、集群流控模式、NTP服务器、LICENSE、总容量、已用容量.
-存储池信息:名称、数据策略、安全策略、运行状态、总容量、已用容量.
-卷信息:名称、卷容量、QOS列表、状态、创建时间.
-快照信息:名称、脏数据容量、创建时间.
-节点信息:名称、管理IP、序列号、系统类型、RAID固件版本、资产名称、状态、网口信息、CPU、内存容量.
设备分组管理ISPIM支持对已接入的服务器进行分组管理,方便运维人员根据实际的业务场景对设备进行分组.
分组提供了用户所关注设备信息及告警信息查看的快速入口.
手动分组:支持用户创建分组,并手动添加设备到分组.
自动分组:支持用户创建条件分组,设备被纳管后自动添加设备到分组.
设备信息报表ISPIM提供报表功能,可以将关心的设备信息导出,支持Word、PDF、Excel格式.
表4-2设备信息报表类别描述资产支持以机房,厂商,型号,部件四种维度生成资产信息报表告警内容包括告警级别分布统计,告警级别百分比统计,实时告警与历史告警详细条目.
支持自定义查询,以导出筛选后的告警条目.
维保设备维保信息报表,涵盖采购时间,过保时间,剩余天数等信息设备信息搜索ISPIM提供快速检索设备信息的功能,方便在海量数据中找到特定的设备,支持按照设备名称、IP地址、厂商、型号、设备状态、资产状态、维保状态等条件搜索.
浪潮物理基础设施管理平台(ISPIM)技术白皮书174.
3.
2设备告警管理ISPIM支持设备告警的多维度展示(数据中心/机房/机柜设备统计、告警集中展示,单台设备告警详细展示),支持告警搜索、屏蔽、重定义、通知和转储功能,方便运维人员根据自身需要从不同维度进行告警管理.
表4-3告警管理功能功能类型描述主动告警ISPIM提供主动监控轮询功能,用户可自定义设置设备的告警规则和通知规则.
从而保障系统对设备的实时监控管理.
被动告警ISPIM提供被动接收不同厂商、不同类型设备告警并对其解析的能力,实现设备故障预警.
告警屏蔽用户可以通过创建告警屏蔽规则,对某些不重要的告警进行屏蔽,避免冗余信息.
告警显示通过告警面板、告警列表,按照告警级别或者设备分类展示告警信息,实时掌握全网设备的运行状况.
同时提供数据中心、机房、机柜与单设备多维度的告警信息统计与分类功能,方便运维人员从多种维度进行告警管理.
告警搜索用户可以根据告警名称、告警源、IP、级别、告警状态、逻辑分组、告警清除方式等对当前和历史告警进行组合过滤搜索,快速锁定告警.
告警通知ISPIM提供邮件和短信的自定义告警通知方式,通过邮件和短信可以实时将告警信息按照客户制定的规则通知到运维人员.
告警重定义支持各类告警与事件的灵活转换.
南向设置支持OID导入,南向trap解析配置.
告警转储ISPIM提供自动历史告警转储的功能,客户无需关注大量的历史冗余信息.
4.
3.
3设备性能监控性能监控是将设备的CPU、GPU、硬盘、风扇、内存、电源、网卡等关键部件的性能数浪潮物理基础设施管理平台(ISPIM)技术白皮书18据进行统计分析,并以趋势图的形式展现,方便运维人员对设备性能进行监控管理.
表4-4性能统计类型统计类型描述CPU统计CPU利用率、空闲时间百分比、用户态占用时长百分比、系统态占用时长百分比、IO等待占用时长百分比、CPU温度统计GPU统计GPU利用率、显存利用率、显存容量、已用显存大小、显存剩余空间大小、显存时钟频率、核心时钟频率、GPU功耗、GPU温度、GPU风扇转速硬盘统计硬盘利用率、读写速率、读写次数、IOPS、剩余寿命、温度统计内存统计内存利用率、内存大小、已用内存大小、缓冲区内存大小、缓存使用内存空间大小、交换分区使用空间大小统计电源统计当前功率、总功率风扇统计风扇读数、风扇转速百分比网络统计发送速率、接收速率、发送包数、接收包数NFS统计客户端读写速率、服务端读写速率系统负载一分钟、五分钟及十五分钟系统负载微架构单精度浮点运算总和、双精度浮点运算总和、x87指令集双精度浮点运算、单精度浮点运算、双精度浮点运算、CPI、总内存带宽、内存读写带宽、PCIe设备读写速率其他统计电压、电流、温度4.
3.
4设备故障诊断ISPIM能够基于告警引擎、日志等分析结果自动触发对浪潮服务器的故障诊断.
故障诊断是指ISPIM通过带外方式收集服务器日志(可选的通过带内Agent软件-浪潮管理驱动软件Teye收集带内系统日志、存储等类型日志),并对日志进行智能分析,以判断服务器是否存在故障隐患.
对于采集到的设备日志,ISPIM通过内置的故障诊断流程检测及智能故障库进行精准的分析,形成设备告警并给出用户建议方案,同时支持自动报修.
图4-5ISPIM故障诊断浪潮物理基础设施管理平台(ISPIM)技术白皮书19当ISPIM分析到设备告警时,能够自动触发故障诊断.
ISPIM内置的浪潮专家智能故障诊断系统,包含全面的故障诊断模型与规则,涵盖的范围包括:产品典型故障,典型案例.
历史故障解决建议.
客服技术专家分析经验.
研发、测试技术专家解决方案.
为故障分析提供强大的数据支持,并给出故障维修建议.
故障库会随着ISPIM版本持续更新.
4.
3.
5智能告警对接ISPIM支持通过SMTP邮件协议、SMPP、CMPP、SMGP、SGIP、短信猫或HTTP/HTTPS协议的方式,将自身告警及纳管设备的告警,按照可定制化格式实时发送给用户.
表4-5告警对接功能类描述短消息服务器提供运营商短消息服务器的配置方式.
邮件服务器提供对接的SMTP服务器配置功能,可配置项包括:邮件服务器地址、端口、认证方式、启用开关等.
短信猫服务器支持配置短信猫的网络制式、串口名称、波特率、号码、开关等.
短信网关服务器提供短信网关服务的通用配置及定制化属性配置.
通知内容模板提供自定义的通知模板,方便用户对接.
浪潮物理基础设施管理平台(ISPIM)技术白皮书204.
4智能的能耗管理ISPIM能够基于数据中心及其所有设备的能耗、温度、气流、CUPS等数据,通过AI算法进行数据的过滤、聚合与分析,提供智能的功耗管理与优化建议.
内容包括:数据中心多维度功耗统计:以数据中心,机房,机柜,设备维度,对资源的进风口/出风口温度,功耗,气流,计算利用率进行统计.
灵活的服务器功耗策略:服务器是数据中心功耗的最小维度,ISPIM支持浪潮服务器的功耗策略设置,包括最低功耗策略,动态功耗策略,支持策略生效时间的灵活定义.
能耗优化:支持多种智能功耗优化功能.
-制冷分析:展示机房维度的设备温度分布曲线图,以三种标准制冷规范为依据,对机房制冷提供评估建议.
-服务器使用率分析:基于Intel标准的服务器使用率评估算法,检查数据中心是否存在使用率较低的服务器,通过整合低使用率的服务器的工作负载,进一步对能耗进行优化.
-服务器功耗特征:在设备型号维度,呈现设备的功耗上限与下限分布区间,为用户提供依据,以检查是否能够升级或淘汰某些服务器以提高数据中心的能效.
-能耗优化:跟据服务器的CUPS数据,智能分析其对指定负载的承载能力,以帮助用户进行负载的分配与迁移.
-高级功耗模型:通过服务器历史CUPS数据与功耗曲线,生成智能功耗模型,用户可跟据模型预测服务器在指定计算利用率下的功耗.
4.
4.
1用户场景问题每个数据中心可提供的总功耗是一定的,当机房设备较多、功耗较大,设备所需总功耗超过机房供电上限时,可能会导致部分设备随机断电或由于功率不足而出现性能降低等问题.
在数据中心运维过程中,客户常见的功耗管理的场景与诉求如下:查看数据中心/机房/机柜的整体能耗.
浪潮物理基础设施管理平台(ISPIM)技术白皮书21发现机房高温设备,优化制冷方案.
发现僵尸服务器,优化、调整业务.
预测服务器运行功耗.
限制异常高功耗设备.
评估服务器业务上线、业务迁移的承载能力.
分析设备使用率,优化系统部署方式,提高服务器使用率.
4.
4.
2功耗性能历史曲线ISPIM建立数据中心、机房、机柜到设备的树状列表,用户可以在每一层及查看功耗性能数据,包括温度、功耗、气流和CUPS等数据.
数据以图表形式展示,并提供近一小时、近一天、近一周直至近一年等时间展示功耗性能数据变化信息.
表4-6功耗资源维度资源温度气流功耗计算利用率数据中心是是是否机房是是是否机柜是是是否设备是是是是4.
4.
3功耗策略功能介绍ISPIM允许用户针对单台设备制定相应的功耗限制策略,以限制服务器的最大功耗.
策略的内容包括:是否启用:建立策略后,可以随时单独关停或启用某条策略时间周期:策略启用后,会在设定的时间周期内生效功耗上限:策略的主要作用是通过降低CPU频率等手段限制设备的功耗,当策略启用并生效时,设备的功耗会被限制在设定的功耗上限附近.
浪潮物理基础设施管理平台(ISPIM)技术白皮书22兼容机型ISPIM的功耗策略功能当前兼容的机型包括:浪潮M4和M5系列服务器.
4.
4.
4能耗优化ISPIM通过五大功能辅助运维人员全面降低机房能耗.
图4-6ISPIM能耗优化功能制冷分析制冷分析是对机房内的设备入风口温度进行分析,展示机房内的温度分布情况,列出机房内的高温热点并给出合理制冷建议.
用户可以根据使用场景,在三种不同的规范中选择其中一个,包括:ASHRAE推荐温度18℃-27℃.
ASHRAE一级许可温度15℃-32℃.
ASHRAE二级许可温度10℃-35℃.
浪潮物理基础设施管理平台(ISPIM)技术白皮书23服务器使用率分析服务器使用率分析是采用功耗数据或者CUPS对服务器的使用率进行评估,发现使用较低的僵尸设备,展示平均使用率和99%的时间使用率,并预测优化节省能耗;使用AI算法,分析服务器使用规律,总结设备日使用率分布情况.
图4-7服务器使用率分析服务器功耗特征功耗特征是根据功耗进行分析,展示每种型号服务器在托管时间里的功耗上限和下限,并统计每种型号服务器功耗上限和下限的分布情况.
通过该方式,展示每种型号服务器的功耗波动范围,可以及时发现高功耗设备型号.
负载分配分析ISPIM提供方便易用的负载分配和负载迁移方法.
负载分配:根据用户所需的计算利用率(CPU、IO和内存的带宽利用率),对服务器的承载能力进行评估,列出服务器承载能力评分.
负载迁移:根据用户选择的所需迁出负载的设备,对其他服务器进行承载能力评估,列出服务器承载能力评分.
图4-8负载分配&迁移浪潮物理基础设施管理平台(ISPIM)技术白皮书24高级功耗模型高级功耗模型是根据设备CUPS和功耗,通过AI算法对设备功耗进行分析,建立高级功耗模型.
模型支持从三个维度(CPU、IO和内存的带宽利用率)进行设备功耗的预测.
图4-9功耗模型4.
5高效的无状态管理ISPIM基于服务器BMC带外管理接口实现固件配置与升级、操作系统部署,并能够基于设备当前的状态生成模板,实现设备的无状态管理.
ISPIM提供的不间断监控能够实时侦测设备的状态变更,提供告警与自动还原功能,保证设备的合规性.
图4-10设备无状态管理浪潮物理基础设施管理平台(ISPIM)技术白皮书254.
5.
1标准化的基线管理ISPIM提供标准的统一基线管理,包含基线模板和基线策略两大功能.
通过基线模板,用户可将具体型号的浪潮服务器的最优配置设置成基线模板.
通过基线策略,用户可以对偏离基线模板的设备进行处理,例如:是否按照基线模板进行固件更新,是否产生偏离基线的告警.
基线管理模块会定时采集机型的固件版本、与基线模板进行匹配,对于偏离基线的设备进行自动化的基线校准,为设备的稳定运行提供保障.
用户场景问题不同型号的设备都有满足用户业务需求的最优固件版本,设备在运行过程中存在主板更换及新上架服务器导致固件版本与最优固件版本不一致的问题.
基线管理模块提供完整的解决方案,实现了自动化的基线比对,基线告警与自动较准.
基线模板基线模板提供浪潮服务器的固件版本基线的设置功能,用户可以将具体型号的浪潮服务器最优固件版本设置成模板,模板信息主要包括机型、固件版本、刷新策略.
基线模板为服务器设置基线标准,为自动化矫正提供基础.
浪潮物理基础设施管理平台(ISPIM)技术白皮书26基线策略基线策略设置能够针对于偏离基线的设备进行处理,例如是否按照基线模板进行固件更新,是否对偏离基线的设备产生相应的告警.
基线策略包括:固件变更策略、告警产生策略.
4.
5.
2高效快捷的固件管理固件升级ISPIM实现了浪潮机架、机柜服务器生命周期内全固件升级管理.
用户可以选择连接官方镜像库,通过机器序列号自动同步服务器固件或者手动上传固件至本地镜像库.
固件升级主要提供带内带外两种方式,带外可以通过RESTFUL接口实现BIOS和BMC固件升级,带内可以结合BMC、ISQP完成BIOS、BMC、网卡、RAID卡、HBA卡、硬盘的固件刷新.
针对M5系列服务器的BMC升级,支持升级和生效分离,保证升级流程对客户业务系统无影响.
图4-11升级流程4.
5.
2.
1.
1用户场景问题①场景一、多节点(无ISQP)远程更新,实现方案ISPIM数据中心创建,大批量服务器需要上架,需要进行BIOS和BMC升级.
设备运行一段时间,固件版本问题需要修复,需要进行固件升级.
机器较多,固件版本较多,人工升级容易造成失误.
大批量的固件升级,如果采用人工作业方式,效率很低.
②场景二、多节点(有ISQP)远程更新,实现方案ISPIM+BMC+ISQP数据中心创建,大批量服务器需要上架,需要进行BIOS、BMC、网卡、RAID卡、浪潮物理基础设施管理平台(ISPIM)技术白皮书27HBA卡、硬盘等部件的固件升级.
设备运行一段时间,固件版本问题需要修复,需要进行固件升级.
机器较多,固件版本较多,人工升级容易造成失误.
大批量的固件升级,如果采用人工作业方式,效率很低.
4.
5.
2.
1.
2升级流程ISPIM方式用户可以选择从官方镜像库或从本地直接上传镜像文件,ISPIM通过BMC的RESTFUL接口,完成BIOS和BMC固件升级ISPIM+BMC+ISQP方式用户可以从官方镜像库同步需要升级的固件包,ISPIM通过指令引导ISQP启动,待浪潮物理基础设施管理平台(ISPIM)技术白皮书28ISQP启动完成后,将需要升级的固件包通过远程KVM挂载到需要升级的服务器,由ISQP来自动完成全固件的刷新.
4.
5.
2.
1.
3兼容性列表表4-7固件升级兼容性列表分类型号BIOS/BMC浪潮M4、M5系列服务器,i24机柜服务器.
网卡1网卡_I_10G_X710DA2_LC_PCIEx8_2_XR2网卡_M_25G_MCX4121A-ACAT_LC_PCIEx8_D_XR1网卡_BROADCM_25G_57414_LC_PCIEx8_2_XR_42C2网卡_SND_1G_I350_RJ_PCIEX4_2_XR_OCPRAID卡1SAS卡_L_8R0_9400-8i_HDM12G_PCIE32SAS卡_Inspur_PM8222_SmartHBA_8_SAS3_PCIE33SAS卡_Inspur_PM8222_PM8222_8_SAS3_PCIE4SAS卡_INSPUR_SAS3008+IT+PCIE3.
05SAS卡_INSPUR_SAS3008+IR+PCIE3.
06RAID卡_Inspur_SAS_3008_8_128Mb_12G_37RAID卡_Inspur_PM8204_RA_8_2GB_SAS3_PCIE38RAID卡_L_8R0_9460-8i_2GB_HDM12G_PCIE39RAID卡_L_16R0_9460-16i_4GB_HDM12G_PCIE310RAID卡_L_8R0_9361-8i_1G_HDM12G_PCIE311Raid卡9361-24iHBA卡硬盘1硬盘_S_16KT_ST16000NM001G_7.
2K3_6_SN022硬盘_W_14KT_WUH721414ALE6L4_7.
2K3_63硬盘_T_2.
4KS_AL15SEB24EQ_10k2_124硬盘_S_2.
4KS_ST2400MM0129_10k2_12_C0045硬盘_SA_480TD_MZ7KH480HAHQ_T2_6_7404Q_SM浪潮物理基础设施管理平台(ISPIM)技术白皮书29固件配置ISPIM支持将一台设备的配置(BMC/BIOS)形成一个配置模板文件,支持批量节点配置,同时配置文件可导入、导出,可以快速复制到其它设备,实现硬件配置的灵活变更,提升服务器运维效率.
4.
5.
2.
2.
1设备配置项对运维场景下常见的配置操作进行模板化管理,实现图形化操作,操作简便.
表4-8设备配置项类型描述BIOS配置提供对服务器设备BIOS的配置功能,主要配置项如下:Boot配置、处理器配置、芯片配置、端口号配置、硬盘配置、电源配置.
RAID配置带外管理通过带外方式,提供RAID卡类型为LSI和SAS的服务器的RAID创建功能.
带内ISO通过制作LiveCD,带内挂载的方式,提供RAID卡的创建和配置功能.
带内TF卡通过结合ISQP的方式,带内执行RAID创建和配置功能.
BMC配置SNMP配置支持SNMPTrap告警设置、告警策略设置.
NTP配置提供对服务器NTP模式、NTP服务器地址的配置功能.
SMTP配置提供对服务器的SMTP服务设置功能.
用户配置提供对服务器用户名的新增、修改功能.
服务配置提供对服务器KVM/CD-Media/HD-Media/SSH服务的状态、端口、和超时时间设置功能.
网络配置提供对服务器的网络设置功能,包括IPv4、IPv6和VLAN设置.
DNS配置提供对服务器的域名、主机、域名服务器配置功能.
SNMP请求提供对服务器的SNMPGet/Set配置的功能.
浪潮物理基础设施管理平台(ISPIM)技术白皮书30类型描述配置BMC日志配置提供对服务器的BMC日志启用状态、记录类型、服务器地址、端口、协议类型的配置功能.
BIOS配置提供对服务器设备BIOS的配置功能,主要配置项如下:Boot配置、系统启动顺序、处理器配置、内存配置、硬盘配置、VMX.
RAID配置提供对服务器设备批量的RAID配置操作,方便运维人员根据实际的需求进行RAID配置规划和修改,简化了RAID配置过程,提高了配置效率.
NTP配置提供对服务器NTP模式、NTP服务器地址的配置功能.
SMTP配置提供对服务器的SMTP服务设置功能.
用户配置提供对服务器用户名的新增、修改、删除功能.
Trap配置支持SNMPTrap告警设置、告警策略设置.
4.
5.
3简便易用的部署管理用户场景问题操作系统部署与配置操作繁琐,人工作业非常不便.
数据中心业务上线,大批量服务器需要部署操作系统,如何减少人工操作,提升效率.
PXE方式OS部署,需要配置DHCP、FTP服务,还需要划分网络配置,网络配置复杂.
设备上线一段时间需要重新部署,PXE方式会破坏已有网络,如何快速重装系统.
部署管理ISPIM的操作系统批量部署功能,相比传统的网络(PXE)OS部署,不需要配置DHCP、浪潮物理基础设施管理平台(ISPIM)技术白皮书31FTP服务,不需要进行网络划分与配置等复杂操作,部署过程仅依赖BMC带外网络,支持带有自定义KS文件的OS镜像,支持默认配置修改,支持手动分区,支持系统盘设置,支持IP配置,同时支持安装完成时状态的自动获取,支持批量部署.
部署前,设备需先配置好RAID,并且需要设置RAID启动盘.
操作系统部署支持的设备类型为浪潮M5系列服务器.
表4-9操作系统兼容性列表镜像类型镜像版本号RedHatRHEL7U3、RHEL7U4、RHEL7U5VMwareESXi6.
0、ESXi6.
5、ESXi6.
7CentOSCentOS7U3、CentOS7U4、CentOS7U54.
5.
4统一的镜像文件管理用户场景在无状态管理中,用户需要面对种类繁多的镜像文件,对于固件升级文件,需要按照镜像类型(BIOS、BMC、网卡、RAID卡、HBA卡、硬盘)对固件的版本进行统一的管理.
对于操作系统镜像,需要按照操作系统类型,操作系统版本,是否包含自定义KS文件等多种维度对镜像文件进行管理.
仓库ISPIM仓库主要针对于固件升级文件和系统安装OS介质进行统一管理.
操作系统镜像仅支持本地文件上传方式,按照系统类型、版本进行分类管理,系统安装OS介质包括ESXI、CentOS、Redhat.
固件仅支持本地文件上传方式,按照固件类型、版本进行分类管理包支持自动管理和手动管理两种方式:自动管理:ISPIM可以连接官方镜像库网站情况下,支持从官方镜像库自动导入升级包.
手动管理:ISPIM无法连接官方镜像库网站情况下,支持从其他可连接官方镜像库网站的设备下载升级包,并拷贝到ISPIM端,通过ISPIM导入升级包浪潮物理基础设施管理平台(ISPIM)技术白皮书324.
6可视化拓扑管理4.
6.
13D拓扑ISPIM支持3D机房功能,通过三种视图(温度视图、功耗视图、状态视图)展示机房内机柜位置、功耗、温度状态信息,内容包括:机房基本信息:机房内设备数量统计、状态统计和机房温度、功耗.
机房温度信息:通过3D视图呈现机房内温度分布情况,便于用户调整机房制冷.
机房功耗信息:通过3D视图呈现机房内各个机柜的功耗分布.
机房状态信息:通过3D视图呈现机房内异常状态设备所在的机柜.
图4-123D机房4.
6.
2网络拓扑ISPIM为用户提供了一个简单实用的可视化网络拓扑管理功能,具有易操作、实用的特点,可以很好地帮助数据中心管理人员维护好网络.
用户场景问题随着互联网的蓬勃发展,数据中心基础设施也在不断地发展和扩大,数据中心网络的管理也越来越复杂,如何提供一个稳定、可靠、安全的网络运作环境成为首要解决的问题.
只有采用行之有效的网络管理机制,才能保障网络能够充分发挥其独特优势.
同时管理人员需浪潮物理基础设施管理平台(ISPIM)技术白皮书33要的是简单化、自动化、智能化的管理工具.
它要能够简化管理人员日常的维护工作,将管理人员从机械、重复的手动监管中解放出来.
它要能够清晰地呈现数据中心网络拓扑结构,标记网络中不同状态的设备类型,自动发现并更新网络中拓扑变化,支持手动编辑网络设备和链路信息,提供简单易用的操作界面.
方案介绍ISPIM基于中国移动NFV规范,通过网络资源端口信息从三方面自动生成网络拓扑结构.
1.
网络设备之间链路ISPIM通过获取交换机、路由器的LLDPmib表的数据,能够获取到交换机、路由器的对端设备ChassisID以及对端端口PortID,通过与资源数据中的所有交换机、路由器的ChassisID字段进行比较,匹配上以后,再将对端的PortID与匹配上的交换机或路由器下的所有端口的Name进行比较,如果相同即这2个端口有链路连接.
2.
服务器业务口与交换机之间链路绘制服务器业务口的链路绘制依赖服务器带内操作系统向交换机定时发送LLDP报文,此报文的ChassisID填写服务器的序列号,PortID填写服务器的端口Mac地址.
交换机收到LLDP报文后,将信息存放在LLDP的mib表中,ISPIM用ChassisID对比服务器序列号,PortID对比服务器端口MAC(忽略大小写),计算出对端连接的是哪个服务器的哪个端口,从而绘制链路.
3.
服务器硬件管理口与交换机之间链路绘制由于部分服务器的硬件管理口不支持发送LLDP报文,这部分的服务器硬件管理口的链路通过Mac转发表的数据进行绘制,链路生成算法为:在ISPIM上手工设置哪些交换机的类型是硬件管理交换机,并正确设置其端口连接类型:上行端口/下行端口/平行端口.
ISPIM获取硬件管理TOR交换机的Mac转发表,并将Mac转发表中的下行端口所对应的Mac地址找到,去服务器配置信息表中匹配服务器的MAC地址,匹配上以后,绘制该交换机端口到该服务器端口的链路,即服务器管理口链路.
客户价值网络拓扑管理能够直观地给用户反映服务器、交换机、路由器等网络基础架构的运行状浪潮物理基础设施管理平台(ISPIM)技术白皮书34况和网络结构,能够给客户带来的主要价值如下:自动发现网络中设备之间的关系并生成网络拓扑结构图分层浏览网络拓扑,支持不同颜色直观展示网络设备和链路状态,清晰直观兼容主流厂商、主流协议的网络设备支持网络设备、网络链路手动编辑管理4.
7智能容灾分布式管理ISPIM提供异地多数据中心、多机房的统一监控管理,将运行的系统任务按照资源的绑定信息负载均衡到不同的代理器执行,不同的采集器又可以把采集到的数据上报给分析器集群,保证了ISPIM监控节点的上限是可以横向扩展的.
同时,ISPIM任务代理器与代理组提供了容灾策略,保证系统的高可用.
另外,应对集中式场景,ISPIM内置了集中式代理器与代理组,保障了ISPIM的拆箱即用.
图4-13智能容灾浪潮物理基础设施管理平台(ISPIM)技术白皮书354.
7.
1采集器ISPIM采集器提供自动和手动绑定资源的策略,保证系统的高可用性.
同时,ISPIM提供了采集器所在设备的运行情况可视化管理,方便用户查看ISPIM采集器的运行状态.
自动绑定:提供按照负载均衡器方式绑定,根据用户录入资源时绑定的负载均衡器,系统自动做负载均衡与容灾迁移.
手动绑定:用户可手动绑定与解绑资源至采集器,从而实现资源的监控管理任务下发.
自动告警:当采集器离线时IOPS自监控模块会检测到集群状态发出告警4.
7.
2分析器ISPIM分析器提供了自动绑定资源的策略,无需在页面上做任何配置.
使用自动化脚本部署完成分析器集群后,不同的采集器就会自动的把数据上报给绑定的分析器.
自动绑定:不同采集器会自动上报数据给分析器,当分析器集群中有离线节点时,系统自动做负载均衡与容灾迁移.
自动告警:当分析器离线时IOPS自监控模块会检测到集群状态发出告警4.
7.
3负载均衡器ISPIM内置负载均衡器为资源绑定采集器的分组策略,同组内的采集器可认为有资源任务负载均衡的能力.
4.
8至关重要的安全管理通过对用户管理、用户登录管理和证书管理等一系列安全策略,实现对ISPIM本身的安全控制,保证ISPIM系统的安全.
4.
8.
1用户管理ISPIM缺省提供admin用户作为超级管理员,用户密码使用不可逆算法,MD5加密存浪潮物理基础设施管理平台(ISPIM)技术白皮书36储保障安全性.
支持用户的查看、增加、删除、修改.
通过设定权限角色来决定用户管理权限.
支持用户的加锁/解锁用户功能,以限制某个指定用户的登录权限.
支持双认证(本地认证+LDAP认证)登录认证:ISPIM支持作用域管理,对用户的不同角色绑定不同的作用域,分别限制不同角色可操作的资源范围.
支持作用域的查看、增加、删除、修改.
4.
8.
2鉴权管理ISPIM共有两种鉴权方式:本地认证、LDAP认证.
本地认证:由ISPIM提供用户管理、登录鉴权、安全策略等功能,为默认的鉴权管理方式.
LDAP认证:支持使用域控制器中的用户域、组域、隶属于用户域的LDAP用户名及其密码登录,可以提高ISPIM系统安全性.
4.
8.
3安全配置ISPIMWeb默认为HTTPS安全访问模式.
在用户密码连续错误的情况下(默认为5次),将会锁定用户一段时间,不允许登录,防止暴力破解.
锁定时间默认20分钟,超级管理员可对锁定用户进行解锁.
4.
8.
4证书管理ISPIM默认采用超文本传输安全协议(HTTPS)进行数据的安全传输,且提供了一个默认证书.
支持证书信息的查看,包含序列号,剩余天数,颁发者,颁发给,开始时间和失效时间.
支持证书的上传,可以上传自己的证书文件(PFX格式文件加证书密码).
证书上传解析成功后,可以确定替换掉当前的证书,系统将重启加载最新证书.
浪潮物理基础设施管理平台(ISPIM)技术白皮书374.
9标准的北向接口ISPIM以资源为中心,对外提供资产、告警、固件配置、固件升级等标准丰富的REST北向接口,便于第三方平台集成.
4.
9.
1用户场景问题对于大型数据中心,一般需要采购多个厂商的服务器、存储和网络设备,而普通管理软件无法完成设备的统一纳管,只能使用多套管理软件进行管理.
对于多套管理软件,无法对所有设备进行资产、性能、告警等统一的呈现.
用户只能依赖第三方平台对各个管理平台的复杂的且不规范接口进行集成,以达到设备的统一管理,而不规范的北向接口会给集成带来不便.
4.
9.
2方案介绍ISPIM不仅具有管理不同厂商的服务器、存储和网络设备的能力,还具有标准的Restful、SNMP等北向接口,供第三方管理平台进行集成.
同时,ISPIM可以通过浪潮SCCMPlugin与微软SCCM进行整合,实现浪潮服务器的配置;通过浪潮SCOMPlugin与微软SCOM进行整合,实现浪潮服务器的监控管理;通过浪潮VMwarePlugin与VMwarevCenter进行整合,实现浪潮服务器的监控管理.
图4-14北向实施方案浪潮物理基础设施管理平台(ISPIM)技术白皮书38通过如上方案,第三方平台可以通过ISPIM北向接口或者浪潮SCCM/SCOM/VMwarePlugin,实现对浪潮服务器的资产、告警、固件配置、固件升级等功能,从而实现对浪潮服务器的全面管理,便于用户对所有设备进行统一管理.
4.
9.
3客户价值第三方平台通过标准丰富的北向接口实现对浪潮服务器的统一管理,从而实现对所有设备的统一的呈现、告警与配置.
SCCM/SCOM/VMware管理平台,通过浪潮SCCM/SCOM/VMwarePlugin实现对浪潮服务器的统一管理,实现对浪潮服务器的资产、告警与配置的管理.
5部署方案5.
1部署方式ISPIM根据纳管的节点数量、业务场景,提供单节点部署、高可用部署等方案.
5.
1.
1单节点部署ISPIM单节点部署具备"拆箱即用"(out-of-the-box),省去传统部署的繁琐步骤.
5.
1.
2高可用部署ISPIM支持完备的1+1+N高可用部署方案,仲裁器采用主备部署方案.
采集器,分析器采用集群式部署方案,可根据部署节点数灵活调整分析器及采集器个数.
保证仲裁器高可用的同时如果采集器,或者分析器集群中有节点出现故障,资源可平均分配给其他采集器或者分析器上.
单数据中心万级节点规模主备1分钟内完成全部切换,多数据中心万级规模5分钟内完成切换.
图5-1高可用部署示意图浪潮物理基础设施管理平台(ISPIM)技术白皮书395.
1.
3采集分析集群部署ISPIM采集器与分析器支持横向扩容,对原有集群无任何影响.
部署时只需要把扩容节点的IP及用户名密码在配置文件填写完成后即可一键部署5.
2升级方式ISPIM提供版本升级包,一键升级,安全可靠.
新版本生效需要重启ISPIM服务时,时间大约10分钟.
浪潮物理基础设施管理平台(ISPIM)技术白皮书406安全性6.
1组网约束由于ISPIM内部已经占用了3306、8086、8888、32313、32314、32315、32316、32317、32318、32319、32320、32321、32322、32323、32324、32325、32326、32327、32229、161、162、623端口,在规划端口时,和ISPIM业务相关的设备的其他业务需要避开这些端口.
表6-1组网约束源端口目的设备目的地址端口协议端口类型是否可修改认证方式加密方式随机硬件设备硬件管理口80TCP采集服务器信息不涉及用户名、密码HTTP协议无加密随机硬件设备硬件管理口161TCP/UDP采集服务器信息不涉及v1/v2c:团体名v3:用户名/密码加密算法:MD5/SHA隐私算法:AES/DES随机硬件设备硬件管理口443TCP采集服务器信息不涉及用户名、密码HTTPS使用TLS随机硬件设备硬件管理口623TCP/UDP采集服务器信息不涉及用户名、密码随机采集器部署设备采集器162TCP/UDP服务器客户端告警上报至服务端(snmp)是v1/v2c:团体名v3:用户名/密码加密算法:MD5/SHA隐私算法:AES/DES随机UI部署设备UI8888TCP监控软件是Token认证HTTP协议无加密浪潮物理基础设施管理平台(ISPIM)技术白皮书41源端口目的设备目的地址端口协议端口类型是否可修改认证方式加密方式web(http)随机UI部署设备UI32313TCP监控软件web(https)是Token认证HTTPS使用TLS随机分析器部署设备分析器32325TCP上报采集到的数据(http)是Token认证HTTP协议无加密随机采集器部署设备采集器32320TCP仲裁器下发采集任务(http)是Token认证HTTP协议无加密随机仲裁器部署设备用户服务32324TCP监控软件(http)是Token认证HTTP协议无加密随机北向服务部署设备北向服务32321、32322TCPISPIM北向接口(http、https)是Token认证HTTP协议无加密HTTPS使用TLS随机采集器部署设备采集器32314、32315TCP采集器接收指令(RMI)是证书认证RMI协议TLS加密随机分析器部署设备分析器32318、32319TCP分析器接收数据是证书认证RMI协议TLS加密浪潮物理基础设施管理平台(ISPIM)技术白皮书42源端口目的设备目的地址端口协议端口类型是否可修改认证方式加密方式(RMI)随机仲裁器部署设备仲裁器32316、32317TCP仲裁器接收任务状态是证书认证RMI协议TLS加密随机北向服务部署设备北向服务32230、32231TCP北向服务接收数据(RMI)是证书认证RMI协议TLS加密6.
2系统安全用户可以从操作系统加固来了解ISPIM的系统安全.
操作系统加固ISPIM基于CentOS7.
7操作系统,并经过安全加固,确保应用程序运行在安全的环境中.
ISPIM操作系统镜像仅保留了CentOS7.
7所需的核心服务,通过操作系统最小化安装,确保只安装和启用系统必须的服务,减少被黑客攻击的风险.
ISPIM选用安全稳定的数据库版本和其他中间件版本,以解决最基本的安全问题.
6.
3应用安全ISPIM的应用安全体现在访问安全、数据安全、通信安全、编码安全和日志审计安全五个方面.
访问安全应用程序并不是单独存在的.
它们不仅能访问其他系统和应用程序,而且能够被系统管理员、用户、业务支撑系统、其他系统和其他应用程序等访问.
因此,应用程浪潮物理基础设施管理平台(ISPIM)技术白皮书43序中必须设计适当的访问安全方案.
在ISPIM的应用程序中,访问安全措施通过帐号管理、身份验证、密码管理方面执行.
数据安全应用系统中最重要的数据包括:系统数据、数据库数据、机密数据、用户私有数据等.
ISPIM应用程序通过加密技术、访问控制措施来保护数据的安全.
加密技术是保护数据最重要也是最普遍的方法.
为了确保加密的效果和性能,ISPIM应用程序遵守如下加密规范:不使用有缺陷的算法,例如SHA-0/SHA-1/DES等,尤其是一些被破解的算法.
采用SHA-256/HMAC-SHA-256/AES/PBKDF2等算法.
通信安全应用程序必须与其他系统和组件通信,相互之间交互信号与数据.
如果通信存在漏洞,不仅会威胁通信的信息,而且还会威胁到应用程序和整个系统.
所以通信安全是应用层安全的重要组成部分.
采用身份验证、加密协议、完整性保护等技术确保通信安全.
在建立一个通信连接之前必须执行严格的身份验证.
使用TLS/HTTPS协议代替不安全的协议.
编码安全编码安全是系统安全的基础.
许多攻击利用系统编码的漏洞,如缓冲区溢出、拒绝服务、SQL注入等.
ISPIM应用程序遵循编码安全规范,如下:最小化受攻击面:即最小化或者加强应用程序暴露的功能,尤其是网页和通信接口.
最小特权原则:越多特权会产生越多风险,因此应用只能拥有最少的特权.
故障保护:避免不合理的故障产生的漏洞.
不受信服务:所有的外部系统都需要经过不受信处理.
职责分离:不同职责不同的角色能够避免在职者集中的系统中权限滥用.
消除编码中的不安全因素:必须加强关键系统和应用程序源码的安全性.
保持简单的安全措施:开发中应避免使用双重否定和复杂的结构而使用更简单的方法将会更快和更简单.
浪潮物理基础设施管理平台(ISPIM)技术白皮书447可靠性7.
1集群可靠性ISPIM支持集群管理,多个ISPIM节点加入一个集群后,可由其中一个节点对整个集群系统进行管理.
当管理节点出现故障,另外一个节点会自动接管,不会影响业务运行.
7.
2数据可靠性备份与恢复功能是保证系统在出现异常情况时,能够快速恢复正常运行的重要保证.
ISPIM支持数据库的备份与恢复,可根据系统情况设置备份策略为自动备份或手动备份.
可以设置定期备份的周期和备份的路径.
浪潮物理基础设施管理平台(ISPIM)技术白皮书458配置要求为保障ISPIM正常运行,所属设备的的硬件配置必须满足一定的要求.
表8-1ISPIM主服务配置要求采集分析集群节点建议每2000个节点增加一个节点要求配置如下表所示.
表8-2ISPIM采集分析集群节点配置要求项目要求操作系统ISPIM-V6.
0.
0-*.
isoCPU500节点以下>=8核2000节点以下>=16核内存500节点以下>=16GB2000节点以下>=32GB硬盘>=300GB(当管理规模大于1000节点时,建议每1000节点增加100GB)网卡>=1个项目要求操作系统Centos7.
8最小化安装CPU8核内存32GB硬盘>=200GB网卡>=1个浪潮物理基础设施管理平台(ISPIM)技术白皮书46A如何获取帮助A.
1收集必要的故障信息在进行故障处理前,需要收集必要的故障信息.
收集的信息包括:客户详细名称、地址联系人姓名、电话号码故障发生的具体时间故障现象的详细描述设备类型及软件版本故障后已采取的措施和结果问题的级别及希望解决的时间A.
2如何使用文档浪潮电子信息产业股份有限公司提供全面的随设备发货的指导文档.
指导文档能解决您在日常维护或故障处理过程中遇到的常见问题.
为了更好的解决故障,在寻求浪潮技术支持前,建议充分使用指导文档.
A.
3获取技术支持浪潮电子信息产业股份有限公司通过办事处、电话技术指导、远程支持及现场技术支持等方式向用户提供及时有效的技术支持.
浪潮电子信息产业股份有限公司技术支持体系包括:客户服务中心:(+86)400-860-0011;(+86)800-860-0011企业业务网站(https://www.
inspur.
com)浪潮物理基础设施管理平台(ISPIM)技术白皮书47B术语和缩略语术语说明性定义ISPIMInspurPhysicalInfrastructureManager,浪潮物理基础设施管理平台BMCBaseboardManagementController,基板管理控制器BIOSBasicInputOutputSystem,基本输入输出系统RAIDRedundantArraysofIndependentDrives,磁盘阵列DHCPDynamicHostConfigurationProtocol,动态主机设置协议DNSDomainNameSystem,域名系统IPMIIntelligentPlatformManagementInterface,智能平台管理接口SNMPSimpleNetworkManagementProtocol,简单网络管理协议
优林怎么样?优林好不好?优林 是一家国人VPS主机商,成立于2016年,主营国内外服务器产品。云服务器基于hyper-v和kvm虚拟架构,国内速度还不错。今天优林给我们带来促销的是国内西南地区高防云服务器!全部是独享带宽!续费同价!官方网站:https://www.idc857.com地区CPU内存硬盘流量带宽防御价格购买地址德阳高防4核4g50G无限流量10M100G70元/月点击购买德阳高防...
傲游主机怎么样?傲游主机是一家成立于2010年的老牌国外VPS服务商,在澳大利亚及美国均注册公司,是由在澳洲留学的害羞哥、主机论坛知名版主组长等大佬创建,拥有多家海外直连线路机房资源,提供基于VPS主机和独立服务器租用等,其中VPS基于KVM或者XEN架构,可选机房包括中国香港、美国洛杉矶、韩国、日本、德国、荷兰等,均为CN2或者国内直连优秀线路。傲游主机提供8折优惠码:haixiuge,适用于全...
hostodo从2014年年底运作至今一直都是走低价促销侧率运作VPS,在市场上一直都是那种不温不火的品牌知名度,好在坚持了7年都还运作得好好的,站长觉得hostodo还是值得大家在买VPS的时候作为一个候选考虑项的。当前,hostodo有拉斯维加斯和迈阿密两个数据中心的VPS在促销,专门列出了2款VPS给8T流量/月,基于KVM虚拟+NVMe整列,年付送DirectAdmin授权(发ticket...
浪潮服务器为你推荐
8080端口8080是什么端口?沙滩捡12块石头价值近百万捡块石头价值一亿 到底是什么石头能价值一亿西部妈妈网九芽妈妈网加盟费多少8090lu.com8090向前冲电影 8090向前冲清晰版 8090向前冲在线观看 8090向前冲播放 8090向前冲视频下载地址??se95se.comwww.sea8.com这个网站是用什么做的 需要多少钱www.zzzcn.com哪里有免费看书的网站邯郸纠风网邯郸市信访局地址m.yushuwu.comhttp www.jiaoyucard.com用户名怎么填雀嘴鳝请介绍下鳄雀鳝这种鱼?雀嘴鳝专家教下怎么才能饲养好一条雀鳝鱼?
安徽虚拟主机 高防服务器租用 如何注册中文域名 2019年感恩节 美国主机论坛 阿里云代金券 建站代码 最好看的qq空间 免费个人空间 91vps 视频服务器是什么 www789 免费asp空间 中国域名 浙江服务器 lamp的音标 阿里云邮箱登陆 美国asp空间 建站技术 卡巴斯基免费版 更多