WEB开发网
开发学院操作系统Linux/Unix AIX FAQ 第 4 期 阅读

AIX FAQ 第 4 期

 2009-07-12 08:34:54 来源:WEB开发网   
核心提示: 一个 AIX 命令(例如 fsck)长时间运行或已经挂起了 遇到了不可恢复的错误 —— 在这种情况下,hacmp.out 中会出现“EVENT FAILED”标志 如果遇到 config_too_long 事件,AIX FAQ 第 4 期(5

一个 AIX 命令(例如 fsck)长时间运行或已经挂起了

遇到了不可恢复的错误 —— 在这种情况下,hacmp.out 中会出现“EVENT FAILED”标志

如果遇到 config_too_long 事件,应该检查 hacmp.out 文件,判断原因并决定是否需要手工干预。关于出现事件失败之后的恢复的更多信息,请参见 Administration and Troubleshooting Guide 的第 18 章 Recover from PowerHA Script Failure。

所有节点是否需要使用 PowerHA 和 AIX 操作系统的相同版本?

不。但是,在运行混合型集群时有一些限制。

集群节点上 AIX 的级别不一致不会给 PowerHA 造成问题,只要 AIX 的级别足以支持节点上运行的 PowerHA 的级别即可。在这种环境中支持所有集群操作。PowerHA 的安装和更新包将强制执行每个系统上所需的最低级别的 AIX。

同样,对于 Linux on POWER,只要安装了支持的最低级别,操作系统级别不一致应该不会造成问题。不支持在同一集群中混合使用不同的平台,比如 AIX、RedHat 和 SUSE。从实用性的角度来说,建议所有节点尽可能使用相同级别的操作系统和 PowerHA。保持所有节点上的操作系统、PowerHA 和应用程序处于相同级别可以简化集群的管理,减少发生错误的可能性,这会大大减少管理员遇到的麻烦。Planning Guide 对有效地管理不同的安装和迁移场景给出了建议。

为什么需要非 IP 检测网络?

非 IP 检测链路的用途常常被误解。需要非 IP 检测网络是因为 IP 网络上的 PowerHA 检测作为 UDP 数据报发送。这意味着,如果一个节点或网络很拥挤,检测可能被丢弃。如果只有 IP 网络,那么在发生长时间拥挤时,就会认为此节点出现了故障,PowerHA 会启动接管操作。因为此节点实际上仍然是活跃的,PowerHA 接管会造成两个节点具有相同的 IP 地址,还会造成这两个节点同时试图拥有和访问共享磁盘。这种情况有时候被称为“分裂的集群”。在这种情况下,数据损坏是不可避免的。

上一页  1 2 3 4 5 6  下一页

Tags:AIX FAQ

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接