ContentsIntroductionPrerequisitesRequirementsComponentsUsed排除方法故障术语与缩略语内存安置内存错误可校正与无法修复的错误排除DIMM故障通过UCSM和CLI检查从GUI的错误检查从CLI的错误登记技术支持的日志文件DIMM列入黑名单清除DIMM的方法列入黑名单错误UCSMGUIUCSMCLIRelatedInformation值得注意的BugIntroduction本文描述如何排除在思科统一计算系统(UCS)解决方案的存储器模块相关问题故障.
UCSusesDual直插式存储器模块(DIMM)作为RAM模块.
PrerequisitesRequirementsCisco建议您有思科统一计算系统(CiscoUCS)知识.
ComponentsUsedThisdocumentisnotrestrictedtospecificsoftwareandhardwareversions.
然而,本文重点CiscoUCSB-系列刀片服务器qUCS管理器qTheinformationinthisdocumentwascreatedfromthedevicesinaspecificlabenvironment.
Allofthedevicesusedinthisdocumentstartedwithacleared(default)configuration.
Ifyournetworkislive,makesurethatyouunderstandthepotentialimpactofanycommand.
排除方法故障此部分包括UCS内存问题的主要部分.
内存安置q通过UCSM和CLI排除DIMM故障q登记技术支持的日志q术语与缩略语DIMM双列直插存储器模块ECC纠错码LVDIMM低压DIMMMCA机器检查的体系结构MEMBIST内存镶入自检MRC内存参考码POST加电自检SPD序列存在发现DDR双数据速率RAS可靠性、可用性和维护性内存安置内存安置很可能是其中一个UCS解决方案的最值得注意的物理方面.
典型地服务器附有内存事前填充与被请求的数量.
然而,不确定时请参见硬件安装指南,应该定期更新,当介绍新的硬件.
对于内存人口规则请参见特定平台的B系列技术规范.
B系列技术规范链路:http://www.
cisco.
com/c/en/us/products/servers-unified-computing/ucs-b-series-blade-servers/datasheet-listing.
html内存错误DIMM错误多位=不可能修正的柱子由BIOS映射,OS看不到DIMM运行时间通常导致OS重新启动一位=可校正OS继续发现DIMMqECC(纠错码)错误q奇偶校验错误qSPD(序列存在发现)错误q配置错误不支持的DIMM不支持的DIMM人口q无对手的DIMMq不匹配错误q身份unestablishable错误q检查并且更新目录q可校正与无法修复的错误一个特定的错误是否可校正或不可能修正的取决于依赖在存储系统内被使用的ECC代码.
当他们发生没有对程序执行时的影响专用硬件能改正可校正错误.
与可校正错误的DIMM不是失效的并且是可用为了OS能使用.
总内存和有效内存是相同的(使用反映的内存).
这些可校正错误在UCSM操作度状态报告了如降低,当整体操作度可行与可校正错误时.
无法修复的错误不通常是固定的,并且可能使不可能为应用程序或操作系统继续执行.
与无法修复的错误的DIMM是失效的,并且OS看不到该内存.
UCSM对""不能操作的""的operState更改在这种情况下.
排除DIMM故障通过UCSM和CLI检查从GUI的错误UCSM日志说明DIMM状态操作度SEL备注可行可行检查SEL日志DIMM相关错误DIMM是安装和工作.
可行降低检查SELECC错误在运行时间期间,一个可校正ECCDIMM错误被发去除不适用没有日志没有安装DIMM或损坏的SPD数据.
禁用可行检查SEL身份unestablishable错误检查并且更新功能目录禁用不适用检查SEL,如果在失败的另一个DIMM在同一条信道因为配置规则不可能由在同一条信道的失败的DIM护DIMM可能是健康,但是失效的.
禁用不适用没有日志没能遵从内存配置规则由于想念DIMM.
不能操作需要的不能操作/更换UE发现了ECC错误.
降低不能操作检查SELECC错误DIMM状态和操作度更改的由于,在主机重新启动前ECC错误发现了.
降低需要的不能操作/更换在POST/MRC期间,检查SELECC错误在运行时间期间,不可能修正的ECC错误被发现了DIMM保持可用对OS,OS失败并且恢复,但是能使用此DIMM.
错误能以后再出现.
应该替换在大多情况下DIMM.
为了得到统计数据请连接对设备>机箱>Server>Inventory>内存然后用鼠标右键单击在内存,并且精选请显示浏览器.
检查从CLI的错误当排除从CLI时的错误故障这些命令是有用的.
scopeserverx/y->showmemorydetailscopeserverx/y->showmemory-arraydetailscopeserverx/y->scopememory-arrayx->showstatshistorymemory-array-env-statsdetail从内存阵列范围您能也获得对DIMM的访问.
范围服务器X/Y>范围内存阵列Z>范围DIMMN从您能那里然后得到每DIMM统计数据或重置错误计数器.
UCS/chassis/server/memory-array/dimm#reset-errorsUCS/chassis/server/memory-array/dimm*#commit-bufferUCS/chassis/server/memory-array/dimm#showstatsmemory-error-state如果看到匹配以上的信息的一个可校正错误报告了,问题可以被重置BMC更正而不是重新安装或重置前端服务器.
请使用这些CiscoUCSManagerCLI命令:重置BMC不影响运行在前端的OS.
UCS/chassis/server/memory-array/dimm#reset-errorsUCS/chassis/server/memory-array/dimm*#commit-bufferUCS/chassis/server/memory-array/dimm#showstatsmemory-error-stateForcolusaservers:UCS#scopechassisUCS/chassis#scopeserverxUCS/chassis/server#reset-ecc使用UCS版本2.
27和3.
1以上,去除了内存被更正的错误的阈值.
所以,存储器模块(DIMM)不再将报告作为"不能操作"或"降低的"独自地由于被更正的内存错误.
根据whitepaperhttp://www.
cisco.
com/c/dam/en/us/products/collateral/servers-unified-computing/ucs-manager/whitepaper-c11-736116.
pdf行业为更加巨大的容量需求,更加巨大的带宽,并且降低工作电压导致增加的memoryerror费率.
传统上,行业以与无法修复的错误相似的方式对待可校正错误,要求模块被替换立即在戒备.
特定广泛的研究可校正错误没有关联与无法修复的错误,并且可校正错误不降低系统性能,CiscoUCS小组推荐模块的立即替换有可校正错误的.
体验可校正错误的一次降低的内存戒备的用户应该重置内存错误和恢复操作.
如果遵从此推荐,避免多余的服务器中断.
对错误管理的将来增进来,并且帮助在可校正错误中的多种类型区分并且识别适当行为,若有,需要.
? ? ? ?创梦网络怎么样,创梦网络公司位于四川省达州市,属于四川本地企业,资质齐全,IDC/ISP均有,从创梦网络这边租的服务器均可以****,属于一手资源,高防机柜、大带宽、高防IP业务,另外创梦网络近期还会上线四川联通大带宽,四川联通高防IP,一手整CIP段,四川电信,联通高防机柜,CN2专线相关业务。成都优化线路,机柜租用、服务器云服务器租用,适合建站做游戏,不须要在套CDN,全国访问快...
萨主机(lisahost)新上了美国cn2 gia国际精品网络 – 精品线路,支持解锁美区Netflix所有资源,HULU, DISNEY, StartZ, HBO MAX,ESPN, Amazon Prime Video等,同时支持Tiktok。套餐原价基础上加价20元可更换23段美国原生ip。支持Tiktok。成功下单后,在线充值相应差价,提交工单更换美国原生IP。!!!注意是加价20换原生I...
VoLLcloud LLC是一家成立于2020年12月互联网服务提供商企业,于2021年1月份投入云计算应用服务,为广大用户群体提供云服务平台,已经多个数据中心部署云计算中心,其中包括亚洲、美国、欧洲等地区,拥有自己的研发和技术服务团队。现七夕将至,VoLLcloud LLC 推出亚洲地区(香港)所有产品7折优惠,该产品为CMI线路,去程三网163,回程三网CMI线路,默认赠送 2G DDoS/C...