DDR内存子系统常见硬件错误及Uboot中检测流程在U-Boot中 Denx U-Boot的开发商针对常见的DDR内存故障进行了严格的检测处理下图描述了该检测处理过程的三个步骤检测数据线、地址线和DDR物理存储部件主要涉及这三个步骤的处理过程和方法对于DDR子系统是很容易出故障并且是很难debug检测出来的而Denx所针对DDR内存故障设计的检测方法是非常严谨值得学习研究的。
下面主要是相关的检测处理思路及问题
1、为什么先检测数据线
因为如果数据线是断开的那么一切无从谈起接下来是检测地址线只有数据线和地址线都通过检测内存的存储单元才有意义这样的流程也利于分割定位问题。上面testing sequence 框图将整个检测过程分成三大步用三个虚线方框表示。
2、数据线的连接错误
数据线的连接可能存在两种错误一种是被断开另一种布线或生产造成互相短路。
3、如何检测数据线的连接错误
Denx设计的数据线检测算法还是很Tricky和精秒的整个处理流程如下例子如果是两根数据线只需要写入并读出一个pattern=0b01 0b开头表示二进制数就能判断它们是否短路或断开。很明显大部分的嵌入式平台不止两根数据线我们以64位地址线为例 pattern = 0b101010101010101010. . . . 能检测出奇偶位之间的数据错误。如果这个错误被排除每两根数据线组成一组这是理解下一个pattern的关键 再用相同的办法检测每相邻两组之间是否有短路就得到第二个pattern就是
0b110011001100. . . . . .依次类推以4根数据线为一组 8根线为一组相继得到共6个pattern分别是0x aaaaaaaaaaaaaaaa
0x cccccccccccccccc 0xf0f0f0f0f0f0f0f0
0xff00ff00ff00ff00 0xffff0000ffff0000
0xffffffff00000000。只要相继写入并读出这6个pattern就能验证是否存在数据线交叉短路错误。
4、如何检测数据线与板上其它信号线交叉短路或断路
取以上6个pattern的反码总共12个pattern就能检测到每一位都可以写入和读出0和1。
5、什么是floating buses错误floatingbuses会“欺骗”测试软件如果测试软件写入并很快读出一个值的时候写操作会给数据线上的电容充电总线会短暂的保持它的状态。当测试软件读操作时总线会返回刚写入的值 即使实际上该数据线是断路的。
6、如何检测数据线的floating buses错误
检测floating buses错误的算法不复杂在写入和读回之间再插入一次对不同地址写入不同值的操作。例如 X写入X1位置,Y 写入Y1位置再从X1位置读出X值则表示floating buses错误不存在。
7、地址线的错误
如果地址线存在错误其症状是地址空间中的两个不同位置被映射到同一物理存储位置。更通俗地讲就是写一个位置却“改变”了另一个位置。
8、地址线的错误检测
地址线的错误检测相对简单其算法是
1 、将地址的值作为内容写入该地址处汇编的表示方法是(addr) = addr。即将地址值写到地址对应的空间里这样确保每一个位置的内容不同。
2 、依次将内存基地址的某一根地址线的值翻转flip/toggle得到某个地址从该地址取值如果该值和基地址的值相等则表示某一位地址线有问题。
这个算法的特点是每次只检测一根地址线方法简单有效。
9、存储单元的错误
以上数据线和地址线的检测都是检测布线或工厂生产的错误而存储单元的检测则是真正对DDR内存芯片的检测。 内存芯片的常见错误是bit-stuck简而言之就是让它是0它偏为1让它为1它偏为0检测方法也很简单就是用不同的pattern去写尽可能所有的地址并读回比较。有一些常用的pattern如0x5555, 0xAAAA等。
10、几个简单的检测DDR故障的方法
上面的DDR检测算法虽然全面但是耗时比较长常常需要好几个小时在Uboo t命令行下也有几个简单的命令可以检测常见内存故障如下所示
1 、 mtest addr lenth pattern
这个命令需要注意 DDR在Uboot启动后被映射到了0地址但是uboot的代码和堆、栈空间0x10000000处开始这些空间是不能被刷的否则就挂死了。
2、复制NOR f lash的内容到内存中如cp.b 0x200800000x7fc0
20000然后比较cmp.b 0x20080000 0x7fc0 20000。
3 、下载kernel image到内存中 copy NOR flash或tftp都行然后调用iminfo LOAD_ADDR检测CRC错误。
第一种方法是用特定的pattern去刷DDR的空闲空间第二种和第三种方法可以说Pattern的随机性更大一些。
当然最彻底的检测方法当然是长时间跑Linux系统上面的方法更适用于系统不稳定时定位错误。
内存检测方法程序示例
DiyVM 香港沙田机房,也是采用的CN2优化线路,目前也有入手且在使用中,我个人感觉如果中文业务需要用到的话虽然日本机房也是CN2,但是线路的稳定性不如香港机房,所以我们在这篇文章中亲测看看香港机房,然后对比之前看到的日本机房。香港机房的配置信息。CPU内存 硬盘带宽IP价格购买地址2核2G50G2M1¥50/月选择方案4核4G60G3M1¥100/月选择方案4核8G70G3M4¥200/月选择...
HostKvm是一家成立于2013年的国外主机服务商,主要提供基于KVM架构的VPS主机,可选数据中心包括日本、新加坡、韩国、美国、中国香港等多个地区机房,均为国内直连或优化线路,延迟较低,适合建站或者远程办公等。目前商家发布了夏季特别促销活动,针对香港国际/韩国机房VPS主机提供7折优惠码,其他机房全场8折,优惠后2GB内存套餐月付5.95美元起。下面分别列出几款主机套餐配置信息。套餐:韩国KR...
Sharktech 鲨鱼机房商家我们是不是算比较熟悉的,因为有很多的服务商渠道的高防服务器都是拿他们家的机器然后部署高防VPS主机的,不过这几年Sharktech商家有自己直接销售云服务器产品,比如看到有新增公有云主机有促销活动,一般有人可能买回去自己搭建虚拟主机拆分销售的,有的也是自用的。有看到不少网友在分享到鲨鱼机房商家促销活动期间,有赠送开通公有云主机$50,可以购买最低配置的,$49/月的...