IBM eServer OpenPower 710 集群入门介绍
2008-12-01 11:02:48 来源:WEB开发网现在就建立起了一个小型的高性能集群,可以试运行并行构建的 Linpack 基准。如果某个计算节点崩溃,管理节点可以把它记录下来,您将知道尽管运行的基准不正确,但是已经执行了适当的动作来恢复出现故障的计算节点。一旦启动并再次运行,您可以重新运行基准并分析结果。
高可用集群示例
高可用(high availability,HA)集群中有足够的冗余资源,在任何一个部分出现故障时都可以保证提供系统功能。本例描述了一个简单的 HA 集群,由三个节点构成:一个主节点,一个备份节点,以及一个管理节点。主节点和备份节点连接到一台 IBM DS4500 存储服务器。此集群常见于小型 Web 服务环境。
研究对象
由于冗余是 HA 集群的关键特性,因而在这个例子中基本的组成部分包括节点管理、分布式文件系统、卷管理和监控。本例展示了如何使用两台 OpenPower 710 型机器使容错成为可能:一台作为主服务器,另一台作为备份服务器。使用监控软件来检测主服务器是否宕机。
细节
与上面所述的高性能集群相同,在管理节点上安装 CSM。管理节点通过运行在 eth1 上的私有管理网络连接到主节点和备份节点,如图 2 所示。管理节点安装主节点和备份节点,并根据需要进行软件更新。
图 2. 高可用集群
Heartbeat 程序包提供了对节点进行监控的软件。为了减少故障,连接被监控的节点时使用的是串行连接,而不是网络连接。Heartbeat 的配置是当主节点偶然宕机时切换到备份节点。这是对 Heartbeat 工作原理非常高层次上的了解,不过,在 High-Availability Linux Project Website 可以找到更多资料。
GPFS 是运行于 DS4500 存储服务器上的分布式文件系统。存储服务器通过高速 myrinet 或者光通道连接到主节点和备份节点,如图 2 所示。GPFS 和 DS4500 共同构成了一个冗余存储子系统,预防磁盘故障。GPFS 允许主节点和备份节点并发访问集群中的所有文件。
在集群上安装 LVM 来执行卷管理。LVM 具备向 DS4500 动态添加和删除存储空间的能力,并不需要打断为正在运行的集群提供的服务。例如,如果存储 Web 内容的文件系统已满,则 LVM 允许您向文件系统添加另一块磁盘来增大存储空间,而并不影响现有数据。
现在您就已经拥有了处理主节点故障(如果它会发生)所需要的所有组成部分。如果 Heartbeat 应用程序发现主节点不可用,那么备份节点就会使用适当的网络配置而运行起来。此时,备份节点正在处理 Web 服务,而且从外部可路由网络来看没有发生任何故障。同时,可以对主节点进行维护,分析它为什么会宕机。
结束语
OpenPower 710 具有基于 64-位 POWER5 处理器的架构,是高可用和高性能集群的理想解决方案。另外,当前可用的大部分 Linux 集群软件都已经移植到 64-位 POWER 架构,这就使得此入门级服务器成为基于 POWER 上 Linux 的集群解决方案的一个可接受的 64-位 平台。
致谢
感谢 Linda Kinnunen 的文档模板以及对本文的审查,感谢 Brent Baude 和 Steve Dibbell 为本文所做的技术审查。
- ››IBM WebSphere常见问题解答
- ››IBM WebSphere Studio V5相关认证资料
- ››IBM WebSphere应用服务器发展趋势
- ››IBM WebSphere Application Server诊断和调优(一...
- ››IBM WebSphere Application Server诊断和调优(二...
- ››IBM WebSphere Performance Pack服务器
- ››IBM WebSphere软件概述
- ››IBM PowerVM 实战手册,第 3 部分 : VIO server 配...
- ››IBM PowerVM 实战手册,第 2 部分 : VIO server 准...
- ››IBM p 系列服务器系统固件升级攻略
- ››IBM PowerVM 概述
- ››IBM Systems Director 在 AIX 上的常见问题及解决...
更多精彩
赞助商链接