WEB开发网
开发学院服务器服务器方案 IBM eServer OpenPower 710 集群入门介绍 阅读

IBM eServer OpenPower 710 集群入门介绍

 2008-12-01 11:02:48 来源:WEB开发网   
核心提示: 现在就建立起了一个小型的高性能集群,可以试运行并行构建的 Linpack 基准,IBM eServer OpenPower 710 集群入门介绍(4),如果某个计算节点崩溃,管理节点可以把它记录下来,这就使得此入门级服务器成为基于 POWER 上 Linux 的集群解决方案的一个可接受的

现在就建立起了一个小型的高性能集群,可以试运行并行构建的 Linpack 基准。如果某个计算节点崩溃,管理节点可以把它记录下来,您将知道尽管运行的基准不正确,但是已经执行了适当的动作来恢复出现故障的计算节点。一旦启动并再次运行,您可以重新运行基准并分析结果。

高可用集群示例

高可用(high availability,HA)集群中有足够的冗余资源,在任何一个部分出现故障时都可以保证提供系统功能。本例描述了一个简单的 HA 集群,由三个节点构成:一个主节点,一个备份节点,以及一个管理节点。主节点和备份节点连接到一台 IBM DS4500 存储服务器。此集群常见于小型 Web 服务环境。

研究对象

由于冗余是 HA 集群的关键特性,因而在这个例子中基本的组成部分包括节点管理、分布式文件系统、卷管理和监控。本例展示了如何使用两台 OpenPower 710 型机器使容错成为可能:一台作为主服务器,另一台作为备份服务器。使用监控软件来检测主服务器是否宕机。

细节

与上面所述的高性能集群相同,在管理节点上安装 CSM。管理节点通过运行在 eth1 上的私有管理网络连接到主节点和备份节点,如图 2 所示。管理节点安装主节点和备份节点,并根据需要进行软件更新。

图 2. 高可用集群

IBM eServer OpenPower 710 集群入门介绍

Heartbeat 程序包提供了对节点进行监控的软件。为了减少故障,连接被监控的节点时使用的是串行连接,而不是网络连接。Heartbeat 的配置是当主节点偶然宕机时切换到备份节点。这是对 Heartbeat 工作原理非常高层次上的了解,不过,在 High-Availability Linux Project Website 可以找到更多资料。

GPFS 是运行于 DS4500 存储服务器上的分布式文件系统。存储服务器通过高速 myrinet 或者光通道连接到主节点和备份节点,如图 2 所示。GPFS 和 DS4500 共同构成了一个冗余存储子系统,预防磁盘故障。GPFS 允许主节点和备份节点并发访问集群中的所有文件。

在集群上安装 LVM 来执行卷管理。LVM 具备向 DS4500 动态添加和删除存储空间的能力,并不需要打断为正在运行的集群提供的服务。例如,如果存储 Web 内容的文件系统已满,则 LVM 允许您向文件系统添加另一块磁盘来增大存储空间,而并不影响现有数据。

现在您就已经拥有了处理主节点故障(如果它会发生)所需要的所有组成部分。如果 Heartbeat 应用程序发现主节点不可用,那么备份节点就会使用适当的网络配置而运行起来。此时,备份节点正在处理 Web 服务,而且从外部可路由网络来看没有发生任何故障。同时,可以对主节点进行维护,分析它为什么会宕机。

结束语

OpenPower 710 具有基于 64-位 POWER5 处理器的架构,是高可用和高性能集群的理想解决方案。另外,当前可用的大部分 Linux 集群软件都已经移植到 64-位 POWER 架构,这就使得此入门级服务器成为基于 POWER 上 Linux 的集群解决方案的一个可接受的 64-位 平台。

致谢

感谢 Linda Kinnunen 的文档模板以及对本文的审查,感谢 Brent Baude 和 Steve Dibbell 为本文所做的技术审查。

上一页  1 2 3 4 

Tags:IBM eServer OpenPower

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接