AIX下删除LV后的现场保护和数据恢复方案-阿里云开发者社区

AIX下删除LV后的现场保护和数据恢复方案

2017-11-08 1123

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

在AIX环境下，因维护误操作、存储mapping错误等，不小心将LV误删除，这种损失通常是巨大的。删除后的不当保护及恢复操作可能使数据无法恢复，也可能增加处理的时间与算法复杂度。如何有效保护现场，并选择正确的数据恢复方案是非常重要的。

AIX的存储层有太多文章描述，做为铺垫，简要描述一下。PV相当于物理磁盘(对于存储，是存储映射过来的卷，对于操作系统而言，等同于物理硬盘)，若干个PV组成一个VG，意味着可以将容量不同的存储空间合起来统一分配。为了实现这个目的，AIX把同一个VG的所有PV按相同大小的存储颗粒进行空间编排，这个存储颗粒就是PP。而分配空间时，以若干个PP(可能是不同PV上的)，做为使用集合，这个集合就是LV。

AIX的LVM层VGDA区域有一个固定的PP到LV的映射表，称为PPMAP。每个PV的所有PP从第一个(PP#1)开始，以固定大小的32个字节记录本PP归属于哪个LV。删除AIX中VG的某个LV，底层上最根本的就是释放这个LV原先占用的PP，也就是清0之前所有占用PP的32字节PPMAP条目，另外还会做一些诸如LV名称的清理、LV设备摘要信息的清理等工作。

LV被删除后，不建议贸然尝试用mklv等操作试图进行灾难恢复。虽然mklv本质上不会清除pp内容区，但有些情况会损坏数据，比如：如果故障前后的PP分配表不相同，但前面PP表分配正确，这样，文件系统可能可以识别，甚至于可以挂上。不过，麻烦的是，挂上后某些结构可能会出现错误，以至于被系统自动修正，事情就会变得更糟。即便是只读方式mount，也不是最优选的做法。

如果时间允许，AIX LV删除后的恢复方案大致为：

1、保持VG状态，不新建任何LV。

2、使用备份手段，对VG中所有的PV做完整镜像。

3、在镜像中进行数据提取恢复。或保护镜像后以分析好的PPMAP，重建丢失的LV。

上述方案的宗旨为：所有操作尽可能可回溯。

【如何完整镜像故障卷】

来说说如何对AIX中的PV做完整镜像(从目前的数据恢复技术看，多数处理和分析过程首选是WINDOWS环境，所以，镜像方案尽量兼顾镜像出来的数据可以在WINDOWS下直接访问)：

第一种方法：如果存储自身有卷镜像功能，可以尝试之。

第二种方法：如果AIX环境中有足够空间，放得下需要镜像的pv，可以将pv镜像成文件(或LV)。如果是文件，可以通过FTP等手段传出来。(不建议此方法)

第三种方法：另外构建一台NFS server，以nfs的方式用dd将pv镜像到nfs上。当然如果aix上可以挂载cifs，甚至于直接可以镜像到windows的共享文件夹下。但windows下如果生成大文件，有可能会越来越慢，可以尽量使用WINDOWS2008或选择其他方案。

第四种方法：建议的方案。具体为构建块设备mapping至aix环境，直接以块设备至块设备的方法进行镜像。可选择的块设备有fc lun，iscsi等。如果不具备fc环境的支撑，至少iscsi(可以是软iscsi)是足够好的方案。

以windows端做iscsi target,AIX环境做iscsi initiator为例，下面为详细过程：