小机更换硬盘步骤
IBM小机更换硬盘步骤其实更换硬盘的操作,只有下面几个步骤, 1、unmirrorvg拆除rootvg的mirror2、reducevg 将要更换的硬盘从vg踢出3、remdev 删除坏盘4、拔出坏盘,插入新盘5、cfgmgr重新扫描识别硬件6、extendvg将新盘扩入vg7、mirrorvg重新做mirror8、bosboot 重新写入hd5引导镜像9、bootlist设置硬盘启动顺序但是因为客户的环境有的很不规范,经常会有很多后建的lv没有做mirror,强行更换会丢失数据,所以在工作的时候一定要做好检查确认工作。一般客户都是装好系统后对rootvg做mirror,但后期客户可能自行添加一些lv,这些lv不会被自动mirror,需要用smittymklvcopy手工做mirror 特别注意AIX里面的操作界面,在不同的telnet客户端的热键会有区别F3 返回上一级菜单,对应按键是ESC+3F10 直接退回到#下,对应按键是ESC+0 下面的操作步骤看上去很繁琐,因为增加了很多辅助的检查工作,还包括很多异常情况的处理方法,确保更换安全可靠。1、先登录到需要更换硬盘的系统,更换硬盘需要root账号,特别注意,在执行操作前,一定要用prtconf|pg命令确认要更换硬盘的机器的型号序列号,千万不要登错了机器。结合hostname和errpt命令判断是不是这台机器要更换硬盘 使用lsvg -p rootvg命令可以查看rootvg里的硬盘pv状态是否正常 注意正常的pv状态都应该是active,有些可能是remove或missing,这个状态的pv硬盘肯定是不正常的。上面图示的正常的,但是某些情况下即使是active硬盘也可能有问题,比如不能新建lv写入数据,会在errpt里面报错。 2、使用diag工具,先找到要更换的硬盘,比如hdisk1(hdiks0操作是一样的)执行diag回车,第一个提示界面回车,看到如下界面,光标移动到task这行上回车 3、新界面移动光标到hot plug task回车 4、光标移动到scsi and scsi raid hot plug manager回车 5、光标移动到identify这行回车 6、可以看到类似如下的界面,里面显示了hdisk1,光标移动到hdisk1上回车 回车后会弹出一个小窗口,不要动7、这个时候到机器上看哪块硬盘在闪灯,这个闪灯的硬盘就是要找的硬盘。在按一下键闪灯结束。8、执行命令lsvg –l rootvg,来确认是不是所有的lv都被mirror可以看到类似如下的界面,注意看LPs 和PPs列的数值比应该是1:2,说明两块硬盘做了mirror。[root@hxpc_server2]/ #lsvg -lrootvgrootvg:LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINThd5 boot 1 2 2 closed/syncd N/Ahd6 paging 32 64 2 open/syncd N/Ahd8 jfs2log 1 2 2 open/syncd N/Ahd4 jfs2 8 16 2 open/syncd /hd2 jfs2 35 70 2 open/syncd /usrhd9var jfs2 8 16 2 open/syncd /varhd3 jfs2 12 24 2 open/syncd /tmphd1 jfs2 16 32 2 open/syncd /homehd10opt jfs2 8 16 2 open/syncd /optfwdump jfs2 2 4 2 open/syncd /var/adm/ras/platform注意某些情况下lv的STATE是open/stale,说明这个lv因为mirror同步状态异常导致,可以尝试syncvg –v roovg解决,如果不成功那么更换硬盘后重新做mirror后应该解决。特别要注意下面的部分所有rootvg里逻辑卷LPs与PPs的比例都应该是1:2,如果有逻辑卷的比例是1:1,说明这个逻辑卷没有被mirror,如果这个lv在坏盘上,那需要迁移到好盘。注意有一个特殊的逻辑卷例外lg_dumplv,这个不会被mirror,比如下面的例子,1:1是正常的lg_dumplv sysdump 8 8 1 open/syncd N/A lspv –l hdisk0 检查hdisk0上有哪些lvlspv –l hdisk1 检查hdisk1上有哪些lv上面的两个输入做比对,检查没有实现mirror的lv在哪块硬盘上,如果在需要更换的坏盘hdisk1上,那么需要使用下面的命令将存在坏盘上的lv迁移到hdisk0好盘上migratepv –l 逻辑卷名字 hdisk1 hdisk0 (逻辑卷的名字是lsvg –l 看到的第一列,类似fslv00)注意有些情况下migratepv会提示不能迁移,可以尝试使用mklvcopy命令对该lv单独做mirror,确保好盘上有该lv,如果mirror也失败,可能会有数据损坏丢失了。 如果没有被mirror的lv存储在好盘上,那么继续。确保好盘上有所有的lv后9、执行命令unmirrorvg rootvg hdisk1 拆除mirror ,要换哪块盘后面就输入哪块盘号注意,在执行命令操作的时候(包括下面的命令步骤)经常会提示需要手工执行savebase,那么执行一条命令后就执行一次savebase,这个命令执行完没有显示。执行了unmirrorvg后执行lsvg –l rootvg 验证是否现在所有lv的比例已经是1:1了执行lspv –l hdisk0 查看hdisk0上的信息执行lspv –l hdisk1查看hdisk1上的lv信息,因为本例是拆除hdisk1,所以这个时候hdisk1上应该已经没有lv了特殊情况下unmirrorvg不成功,比如坏盘有坏道导致某个lv异常不能删除该lv,这个时候确保好盘上的所有lv都有,可以直接拔掉坏盘。拔掉后再执行unmirrorvg命令。如果个别lv因为不能migratepv做过了mklvcopy,可以对该lv单独执行rmlvcopy。10、执行命令ruducevg –d roorvg hdisk1 从rootvg踢出坏盘hdisk1特别注意如果要踢出的硬盘上如果还有lv数据,会提示是否删除,这个时候要确认提示要删除的lv是否还有用。如果是踢出hdisk0,那么执行下面的操作注意,一般lg_dumplv会存在hdisk0上,如果是踢出hdisk0会提示删除lg_dumplv,可以选择y删除,这个lv可以删除,没有这个lv系统可以正常启动,运行也不会出现问题,只是没有了dump device,为了保险在reduce hdisk0前执行下面的操作 sysdumpdev-P -p /dev/sysdumpnull修改主dump设备指向为null在踢出hdisk0的时候会提示是否删除lv,输入y删除。 更换硬盘后,可以手工重建dumplv 10、执行命令rmdev –dl hdisk1 从系统删除硬盘lspv检查是否已经看不到hdisk1了 11、拔掉硬盘,插上新硬盘具体的硬盘位置已经用diag确认好,别拔错。12、执行命令cfgmgr –v 重新扫描硬件 13、lspv查看是否重新认出了hdisk1如果新识别的硬盘没有识别出pvid,就是第二列只看到none,没有16位的pvid字符串,可以执行chdev –l hdisk1 –apv=yes 设置pvid,在lspv检查一下是否有了pvid,比如下面lspv例子的第二列的长字符串就是pvid,刚识别出的硬盘后面的vg部分会显示none 14、extendvg rootvg hdisk1 将新硬盘加入rootvg这个时候lspv能看到新加的硬盘后面是rootvg active了15、mirrorvg -S rootvg hdisk1 重新做mirror,加了-S参数mirror会自动在后台运行,会从老硬盘读取数据写入到新换上的硬盘上,1-2个小时应该会自动做完。这个时候不用等待,直接进行下面16的操作就可以了可以执行topas命令,可以看到hdisk0和hdisk1的读写操作会很busy。执行lsvg –l rootvg 可以看到lv的LPS和PPs的比例是1:2了。16、还需要执行下面的命令bosboot –ad hdisk1 将hd5引导映像写入两块磁盘。 bootlist –m normal hdisk0hdisk1 设置引导顺序bootlist –m normal –o可以看到刚才设置的引导顺序 如果前面是更换的hdisk0,并且删除了lg_dumplv那么执行mklv -t sysdump-y lg_dumplv rootvg 8 hdisk0 (注意这个8根据更换前lsvg –l看到的lg_dumplv的大小确认,原来多大还建多大) 执行sysdumpdev-Pp /dev/lg_dumplv 修改主dump设备指向到lg_dumplv 18、清除黄灯Diag命令进入task。。。。。找到log rapir找到op panel 按回车,前面会出现+号,按F7(有些终端需要按ESC+7),执行成功后服务器面板黄灯熄灭。 19、操作完成。