从一起特殊磁盘阵列(RAID)数据恢复中想到的…
在这个信息大爆炸的时代企业的数据越来越大同时对数据的依赖性越来越强。然而有各种因素的影响企业数据的安全却遭受着极大威胁。如果说容灾备份是保护数据安全的重要手段的话那么没有容灾备份或容灾备份失效的漏网之鱼在遭遇数据灾难之后的数据恢复则是最后一道防线。对于企业的IT故障企业的IT运维人员最有发言权从他们那里可以得知 “磁盘阵列RedundantArrays of Inexpensive Disks RAID数据灾难”是让他们很头痛且最致命的安全事故也是发生得最多的一种严重的故障类型。
RAID的主要功能是容错和高吞吐量性能。根据各种条带和校验算法 RAID分为很多等级常用的有RAID0 RAID1 RAID5 RAID6 RAID10等以及各个存储厂家的一些变种RAID比如HP的双循环RAID5 HPADG IBM的RAID1E、 5EE等。但最常见但还是RAID5 RAID5从性能、价格和安全性上有一个完美的平衡以致于目前大部分存储上是用RAID5做的底层。
RAID5另加一块磁盘做热备就可以同时支持两块磁盘出现故障容错性上已达到RAID6的级别但性能却比RAID6强很多价格也低很多。然而人才是最终因素如果没有及时更换故障磁盘故障磁盘超过RAID限制的数量后 RAID便决然的崩溃数据丢失。
河北某公司4块2TB硬盘组成的RAID5阵列无热备阵列总容量5.4T使用了4T多容量是整个公司的文件服务器文件系统为NTFS 因为两块盘故障离线导致RAID崩溃。此RAID上的数据极其重要并且相当着急使用在当地寻求数据恢复被告知大约需要20多天才能做完而且没有那么大容量的空间还需要自己准备硬盘。只能在短时间内完成恢复。
工程师首先对4块源盘同时做了完整的镜像共花费时间8小时。然后分析RAID结构吃惊的是此RAID的BlockSize 块大小才是1扇区仅512字节这直接导致恢复过程变得极其缓慢。 RAID块大小一般是128/256扇区的据多管理员根据自己的需求进行设置如存储大量小文件的存储块大小相应较小跑数据库则相应要较大但最小不过64扇区最大不过2048扇区此块大小为1扇区的仅是少数几种品牌的小型RAID盒子使用。这给恢复带来难度的同时也可以想像真实应用上RAID的I/O将是多么缓慢。
分析出原始RAID组成参数后再分析出此RAID中早已出现故障的2号磁盘 2号磁盘因出现坏道故障 RAID控制器早已不使用它排除2号磁盘使用其它3块磁盘进行虚拟RAID重组数据一切正常。
此RAID块大小为1扇区通常的RAID虚拟重组软件几乎都不支持工程师对能支持的几款进行了测试恢复导出大约需要20天。显然这不现实不过有多年RAID成功恢复经验的北亚数据恢复中心早已针对此类超小的BlockSize的RAID研发出一款快速恢复软件。采用公司自主研发的RAID大缓冲生成恢复软件搭建虚拟RAID环境将整个虚拟RAID镜像生成到北亚数据恢复中心安全存储池中共花费时间20小时。
下图是RAID大缓冲虚拟重组软件的主界面。
后来重新在此公司的服务器上搭建RAID将数据倒回整个恢复过程花费时间两天数据完美恢复。
虽成功解决了此例事故但带来后期更多的思考数据的安全隐患如RAID原理、设置等。有条件的话最好做好容灾工作。
或许我们也该真正重视这些一直被我们忽略的问题。
收到好多消息,让我聊一下阿里云国际版本,作为一个阿里云死忠粉,之前用的服务器都是阿里云国内版的VPS主机,对于现在火热的阿里云国际版,这段时间了解了下,觉得还是有很多部分可以聊的,毕竟,实名制的服务器规则导致国际版无需实名这一特点被无限放大。以前也写过几篇综合性的阿里云国际版vps的分析,其中有一点得到很多人的认同,那句是阿里云不管国内版还是国际版的IO读写速度实在不敢恭维,相对意义上的,如果在这...
Hostadvice主机目录对我们的服务进行了测试,然后给PQ.hosting颁发了十大WordPress托管奖。为此,宣布PQ.Hosting将在一周内进行折扣优惠,购买和续订虚拟服务器使用优惠码:Hostadvice ,全部优惠10%。PQ.hosting,国外商家,成天于2019年,正规公司,是全球互联网注册商协会 RIPE 的成员。主要是因为提供1Gbps带宽、不限流量的基于KVM虚拟的V...
Hostodo在九月份又发布了两款特别套餐,开设在美国拉斯维加斯、迈阿密和斯波坎机房,基于KVM架构,采用NVMe SSD高性能磁盘,最低1.5GB内存8TB月流量套餐年付34.99美元起。Hostodo是一家成立于2014年的国外VPS主机商,主打低价VPS套餐且年付为主,基于OpenVZ和KVM架构,美国三个地区机房,支持支付宝或者PayPal、加密货币等付款。下面列出这两款主机配置信息。CP...