【服务器数据恢复】Raid阵列更换故障硬盘后数据同步失败的数据恢复案例

服务器数据恢复环境:
IBM某型号小型机+AIX+Sybase+某型号存储阵列柜。
阵列柜12块SAS机械硬盘组成RAID(其中一块为热备盘)。
服务器故障:
一块磁盘出现故障离线,管理员更换磁盘,开始同步数据,数据同步到一半左右时,另一个磁盘也出现故障,逻辑盘无法挂载在小型机上,业务中断。存储管理界面显示两块硬盘故障脱机。其中10号槽位故障硬盘为热备盘,3号槽位故障硬盘情况如下图所示:
【服务器数据恢复】Raid阵列更换故障硬盘后数据同步失败的数据恢复案例
文章图片

【服务器数据恢复】Raid阵列更换故障硬盘后数据同步失败的数据恢复案例
文章图片

【【服务器数据恢复】Raid阵列更换故障硬盘后数据同步失败的数据恢复案例】存储阵列柜中的2组Mdisk加到一个pool中,主要数据pool无法加载,其中三个通用卷均无法挂载,具体情况如下图所示:
【服务器数据恢复】Raid阵列更换故障硬盘后数据同步失败的数据恢复案例
文章图片

管理员联系我们数据恢复中心进行数据恢复。
**
服务器数据恢复过程:**
1、服务器数据恢复工程师使用工具对其中的10块磁盘做镜像, 用PC3000给故障盘做镜像,所有的数据恢复操作都在镜像盘上进行, 不会对原始磁盘数据造成影响。
2、经过北亚服务器数据恢复工程师团队会诊,最后确定了2种数据恢复方案。
数据恢复方案一:对存储进行强制上线操作。
1、首先分析底层数据,找到故障存储中的故障硬盘的离线顺序。
2、修复后离线的故障硬盘。
3、将修复完成的硬盘插回存储进行强制上线操作。
数据恢复方案二:解析存储结构。
1、对Mdisk进行分析和重组。
A、根据用户提供的部分配置信息,将硬盘按照Mdisk组分类。
B、分析每一组Mdisk中的所有硬盘获取相关raid信息。
C、使用数据恢复软件对Mdisk进行虚拟重组。
2、对pool进行分析。
A、分析所有Mdisk获取到pool的相关信息。
B、解析pool在Mdisk上的分布情况。
3、LUN结构分析。
A、分析pool中的条带大小。
B、解析LUN位图,分析各LUN在pool中的分布情况。
C、北亚数据恢复工程师编写程序提取LUN。
【服务器数据恢复】Raid阵列更换故障硬盘后数据同步失败的数据恢复案例
文章图片

验证数据&数据移交 :
对生成出的数据进行随机抽样检测,没有大量数据问题。在存储设备上创建与原先环境一样大小数量的LUN,将提取出的数据LUN的镜像文件复制到存储上创建的LUN中,交给用户。数据移交后,用户重新配置存储环境,数据一切正常,本次数据恢复工作圆满完成。

    推荐阅读