RSS

一次艰难的Oracle RAC安装经历

安装环境:二台 HP ProLiant DL388p Gen8 E5-2620 16G RAM
操作系统:Asianux server 3
oracle: oracle 10.2
存储:HP MAS
09

问题描述 1:网卡不时自动 down

安装操作系统一路正常,没有什么问题,配置好网络之后,用 ssh 登录发现不能登录,原来在 Asianux 上默认不开启 SSH 服务,需要手动开启.

/etc/init.d/sshd start
chkconfg sshd on

开启之后,ssh 连上去,会自动断开,到服务器前重启网卡,一会就好了,以为时自己网络问题,就没太纠结,一路设置好环境准备安装 oracle。安装到大约 92%的时候报错
IMG_20140912_041010
大概就是做 rac2 节点无反应,这个时候我 ping rac2 节点发现已经 ping 不通了,重启 rac1 节点网络,一会又可以 ping 通 rac2 了
IMG_20140912_050807
又重新试了一次,每次到这里就出现网络断开,而且在终端 ping2 台机器都又这个情况发生。开始怀疑时网线问题,换了之后问题依旧,在怀疑时交换机问题,最后直接网线直连,发现问题依旧。

解决方法:

经过不断 google,重要找到一个案例地址:http://blog.csdn.net/aicon/article/details/8053068
服务器型号和我一模一样,也是出现网卡 down 的情况,下载网卡驱动到服务器,通过 rpmbuild 把网卡驱动做成 rpm 包,在 2 个节点上都安装,并重启。再次安装,成功,再没有出现过网卡 down 的情况。折腾人的事情。。

问题描述 2:安装 crs 时最后出现报错

IMG_20140912_090714
出现这个问题,基本时由于 vip,或者 hosts 文件里没配置好,查看 hosts 文件正常,其他配置正常

解决办法:

查看 hosts 配置文件正常,ping vip 地址发现不通,ifconfig 查看 vip 地址并没有绑定到网卡上,手动执行 vipca 命令设置 vip 网卡地址,结果报错

error while loading shared libraries: libpthread.so.0: cannot open shared object file: No such file or directory

google 后发现这个是个 bug,需要修改文件地址:http://www.cnblogs.com/killkill/archive/2011/02/13/1953898.html
分别修改 \$CRS_HOME/bin 目录下的 srvctl 和 vipca 文件,在 vipca 文件 ARGUMENTS=””行之前和 srvctl 文件的 export LD_ASSUME_KERNEL 行之后增加 unset LD_ASSUME_KERNEL 语句 。   修改之后再用 root 用户执行 vipca 就可以了。
查了一下这个问题以前出现过,是 Bug 3937317。但是 vipca 和 srvctl 这两个脚本开头注释部分写着:

#       khsingh  10/07/04 - add workaround for bug (3937317)

再查证,这个问题是 CRS 和 RHEL 5 共同作用的成果,clusterware 升级到 10.2.0.4 能解决。
结语:好长时间没有安装过了,有些早已经忘记,遇到的问题也是很奇葩,尤其第一个问题,在此记录一下。