从一起特殊磁盘阵列(RAID)数据恢复中想到的…
在这个信息大爆炸的时代企业的数据越来越大同时对数据的依赖性越来越强。然而有各种因素的影响企业数据的安全却遭受着极大威胁。如果说容灾备份是保护数据安全的重要手段的话那么没有容灾备份或容灾备份失效的漏网之鱼在遭遇数据灾难之后的数据恢复则是最后一道防线。对于企业的IT故障企业的IT运维人员最有发言权从他们那里可以得知 “磁盘阵列RedundantArrays of Inexpensive Disks RAID数据灾难”是让他们很头痛且最致命的安全事故也是发生得最多的一种严重的故障类型。
RAID的主要功能是容错和高吞吐量性能。根据各种条带和校验算法 RAID分为很多等级常用的有RAID0 RAID1 RAID5 RAID6 RAID10等以及各个存储厂家的一些变种RAID比如HP的双循环RAID5 HPADG IBM的RAID1E、 5EE等。但最常见但还是RAID5 RAID5从性能、价格和安全性上有一个完美的平衡以致于目前大部分存储上是用RAID5做的底层。
RAID5另加一块磁盘做热备就可以同时支持两块磁盘出现故障容错性上已达到RAID6的级别但性能却比RAID6强很多价格也低很多。然而人才是最终因素如果没有及时更换故障磁盘故障磁盘超过RAID限制的数量后 RAID便决然的崩溃数据丢失。
河北某公司4块2TB硬盘组成的RAID5阵列无热备阵列总容量5.4T使用了4T多容量是整个公司的文件服务器文件系统为NTFS 因为两块盘故障离线导致RAID崩溃。此RAID上的数据极其重要并且相当着急使用在当地寻求数据恢复被告知大约需要20多天才能做完而且没有那么大容量的空间还需要自己准备硬盘。只能在短时间内完成恢复。
工程师首先对4块源盘同时做了完整的镜像共花费时间8小时。然后分析RAID结构吃惊的是此RAID的BlockSize 块大小才是1扇区仅512字节这直接导致恢复过程变得极其缓慢。 RAID块大小一般是128/256扇区的据多管理员根据自己的需求进行设置如存储大量小文件的存储块大小相应较小跑数据库则相应要较大但最小不过64扇区最大不过2048扇区此块大小为1扇区的仅是少数几种品牌的小型RAID盒子使用。这给恢复带来难度的同时也可以想像真实应用上RAID的I/O将是多么缓慢。
分析出原始RAID组成参数后再分析出此RAID中早已出现故障的2号磁盘 2号磁盘因出现坏道故障 RAID控制器早已不使用它排除2号磁盘使用其它3块磁盘进行虚拟RAID重组数据一切正常。
此RAID块大小为1扇区通常的RAID虚拟重组软件几乎都不支持工程师对能支持的几款进行了测试恢复导出大约需要20天。显然这不现实不过有多年RAID成功恢复经验的北亚数据恢复中心早已针对此类超小的BlockSize的RAID研发出一款快速恢复软件。采用公司自主研发的RAID大缓冲生成恢复软件搭建虚拟RAID环境将整个虚拟RAID镜像生成到北亚数据恢复中心安全存储池中共花费时间20小时。
下图是RAID大缓冲虚拟重组软件的主界面。
后来重新在此公司的服务器上搭建RAID将数据倒回整个恢复过程花费时间两天数据完美恢复。
虽成功解决了此例事故但带来后期更多的思考数据的安全隐患如RAID原理、设置等。有条件的话最好做好容灾工作。
或许我们也该真正重视这些一直被我们忽略的问题。
GreencloudVPS此次在四个机房都上线10Gbps大带宽VPS,并且全部采用AMD处理器,其中美国芝加哥机房采用Ryzen 3950x处理器,新加坡、荷兰阿姆斯特丹、美国杰克逊维尔机房采用Ryzen 3960x处理器,全部都是RAID-1 NVMe硬盘、DDR4 2666Mhz内存,GreenCloudVPS本次促销的便宜VPS最低仅需20美元/年,支持支付宝、银联和paypal。Gree...
webhosting24决定从7月1日开始对日本机房的VPS进行NVMe和流量大升级,几乎是翻倍了硬盘和流量,当然前提是价格依旧不变。目前来看,国内过去走的是NTT直连,服务器托管机房应该是CDN77*(也就是datapacket.com),加上高性能平台(AMD Ryzen 9 3900X+NVMe),这样的日本VPS还是有相当大的性价比的。官方网站:https://www.webhosting...
有一段时间没有分享Gcore(gcorelabs)的信息了,这是一家成立于2011年的国外主机商,总部位于卢森堡,主要提供VPS主机和独立服务器租用等,数据中心包括俄罗斯、美国、日本、韩国、新加坡、荷兰、中国(香港)等多个国家和地区的十几个机房,商家针对不同系列的产品分为不同管理系统,比如VPS(Hosting)、Cloud等都是独立的用户中心体系,部落分享的主要是商家的Hosting(Virtu...