HACMP 备忘单:使用 AIX 构建冗余环境,获取高可用性
2010-09-02 00:00:00 来源:WEB开发网不要使用开发服务器
多年来,我见识了几个不同的公司中的许多环境,其中,将集群中的一个节点声明为 “生产” 服务器,另一个节点声明为 “开发” 服务器。之所以做出这个决策,原因是这些公司认为仅仅是为了预防灾难发生就使一个服务器在超过 90% 的时间都处于闲置状态简直是在浪费钱财。在此,我必须严正声明:不要这样做。如果采用这种策略,毫无疑问,这两个服务器之间将出现差异,因为开发将导致软件、应用程序和操作系统功能方面的差异。当生产资源组必须故障转移到开发服务器时(因为这只是个时间问题,没有如果),那些差异将阻止故障转移正确进行。
第二步(应该与第一步相符)是调整环境大小,以便每个节点都能同时管理所有资源组。如果您决定要使多个资源组在集群中运行,那么假设最坏的情况是一个节点将一次运行所有资源组。确保这些服务器都拥有足够的处理能力。
第三步,您需要对每个服务器分配和/或共享相同的资源集。如果您使用 SAN 磁盘进行存储,那么用于共享卷组的磁盘必须被分区到所有节点。网络 VLANs、子网和地址应该以相同的方式连接。与您的 SAN 和网络管理员协作,获取启动、持久和服务 IP 地址的地址和磁盘。
第四步,也是最后一步,节点之间的整个操作系统配置必须匹配。用户 IDs、第三方软件、技术级别和服务包都必须一致。为此,一个最好的方法是在一个节点上构建目标配置,执行一个 mksysb 备份,然后使用该备份构建所有后续节点。服务器构建好后,应将它们视为 “连体婴儿”:总是同时在两个服务器上进行一致的更改。
借助当今可用的所有虚拟技术,明智的做法是使用 VIO 来在同一组 System p 服务器和硬件资源上创建一对生产和开发 LPARs,而不是为了试图节省一点钞票而牺牲 HACMP 的真正设计目标。使用共享处理器权重、最大传输单元(MTU)大小和 RAM 分配等工具来向生产 LPARs 提供比开发 LPARs 更多的优势。这样做能够创建一个能够处理故障转移的环境,并使经理和会计师们相信,资金得到了合理的运用。
更多精彩
赞助商链接