浅谈 HACMP 心跳
2008-11-13 10:57:34 来源:WEB开发网其他一些细节
RSCT/HACMP 日志文件
关于 HACMP 心跳的日志存放在 /var/ha/log 目录下。其主要可供分析的有:
nim.topsvcs.enX (enX 为网络端口名 ) 该文件对应的记录了网卡 enX 的网络监控进程的启动,心跳和退出的详细日志。
nmDiag.nim.topsvcs.enX 该文件记录了在心跳出现丢失后,RSCT 对网络拓扑的逻辑分析判断的过程。
Topsvcs.<pid 进程号 >.<cluster name> 该文件是 topsvcs 的主进程日志文件,记录 topsvcs 进程的启动过程,以及心跳网络拓扑改变等重要的事件信息。
心跳网络状态查询命令
我们一般都知道 hacmp 的状态可以通过 /usr/sbin/cluster/clstat 来查看,还有一个命令可以更详细的查看当前集群心跳状态。 lssrc –ls topsvcs 如下图:
# lssrc -ls topsvcs | more
Subsystem Group PID Status
topsvcs topsvcs 315610 active
Network Name Indx Defd Mbrs St Adapter ID Group ID
net_ether_01_0 [ 0] 2 1 S 192.168.21.150 192.168.21.150
net_ether_01_0 [ 0] en0 0x808820f2 0x808820fc
HB Interval = 1.000 secs. Sensitivity = 10 missed beats
Missed HBs: Total: 0 Current group: 0
Packets sent : 1078 ICMP 0 Errors: 0 No mbuf: 0
Packets received: 866 ICMP 0 Dropped: 0
NIM's PID: 307250
net_ether_01_1 [ 1] 2 1 S 172.16.21.1 172.16.21.1
net_ether_01_1 [ 1] en1 0x808820f3 0x808820fc
HB Interval = 1.000 secs. Sensitivity = 10 missed beats
Missed HBs: Total: 0 Current group: 0
Packets sent : 1078 ICMP 0 Errors: 0 No mbuf: 0
Packets received: 434 ICMP 0 Dropped: 0
通过分析心跳包的丢包数量和频率可以判断网络的可靠性和负载情况,一方面可以用来分析和解释异常的 HA 备机切换动作,另一方面可以用来分析系统问题并通过调整系统参数来均衡负载。建议在设计 HA 集群的时候不要使用负载过大的 TCP/IP 网络或者 IO 负载很大的磁盘来做心跳。
小结
HACMP 集群的各种网络故障的分析和判断都是由 RSCT 心跳来实现的,网络故障的判断正确与否也直接影响了 HACMP 对应用的切换和还原,所以了解心跳的过程与原理对于设计与配置 HACMP 高可用集群具有重要的意义。
更多精彩
赞助商链接