IBM P570小型机在线更换HBA卡的详细过程
故障现象:通过errpt命令检查,发现HBA卡故障
其中一台主机中errpt报BC669AA7、3074FEB7等代码错误,同时存储链路发生切换,P570与DS4000亮黄灯,报错信息如下:
P570_RAC1:/# errpt //查看ERRPT报错信息IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTIONBC669AA7 0208152910 P H dac0 CONTROLLER HEALTH CHECK FAILURE3074FEB7 0208152910 T H fscsi0 ADAPTER ERROR3074FEB7 0208152910 T H fscsi0 ADAPTER ERROR3074FEB7 0208152910 T H fscsi0 ADAPTER ERROR3074FEB7 0208152910 T H fscsi0 ADAPTER ERROR
根据以上信息检查主机HBA卡fcs0所在位置U7879.001.DQDKKWT-P1-C5-T1,发现HBA卡已无光,同时通过Storage Manager Client登录DS4000,存储链路发生了切换,由于证明HBA卡fcs0损坏,需要更换。
1、 准备工作
1.1. 处理过程
1) 工具:防静电手套、镙线刀
2) 更换HBA卡期间,尽量选择在业务较闲时操作,防止意外造成业务中断造成较大的损失。
3) 能备份的操作尽量备份,如SAN交换机配置备份、存储配置备份,并确认数据库的备份有效。
2、 检查是否满足AIX版本和文件集的最低要求
官方要求如下:
检查本次需要更换HBA卡的P570,证明已满足官方要求,如下:
P570_RAC1:/# lslpp -l |grep fcp
devices.fcp.disk.array.diag
devices.fcp.disk.array.rte
devices.fcp.disk.rte 5.3.0.42 APPLIED FC SCSI CD-ROM, Disk,
devices.fcp.tape.rte 5.3.0.42 APPLIED FC SCSI Tape Device Software
devices.fcp.disk.array.rte
devices.fcp.disk.rte 5.3.0.30 COMMITTED FC SCSI CD-ROM, Disk,
devices.fcp.tape.rte 5.3.0.30 COMMITTED FC SCSI Tape Device Software
//注 意:
l 在热插拔更换HBA卡的过程中,dar的autorecovery属性必须设置为否(no),否则有丢失数据访问的可能。
l 必须在确认HBA卡更换完成,后续的配置工作也完成之后,才可以“Redistribute Logical Drives to the Preferred Path”,否则有丢失数据访问的可能。
24
【Oracle RAC】Linux系统Oracle 11g R2 RAC 安装配置详细过程-Oracle视频培训教程http://www.fgedu.net.cn/bbs/thread-2776-1-1.html]http://www.fgedu.net.cn/bbs/thread-2776-1-1.html
Linux系统Oracle11gR2 RAC+DataGuard容灾实施与维护(2+1)-视频教程http://www.fgedu.net.cn/bbs/thread-2841-1-1.html]http://www.fgedu.net.cn/bbs/thread-2841-1-1.html