WEB开发网
开发学院操作系统Linux/Unix IBM AIX 持续可用性 阅读

IBM AIX 持续可用性

 2008-09-18 08:24:02 来源:WEB开发网   
核心提示: IBM 还尝试对 FFDC 功能进行了增强,以便在大多数情况下,IBM AIX 持续可用性(8),AIX 中的故障不会导致客户向 AIX 支持部门再次提出解决该问题的请求,这也称为二次故障数据捕获(Second Failure Data Capture,并包括了命令的工作场景和了解某个主题

IBM 还尝试对 FFDC 功能进行了增强,以便在大多数情况下,AIX 中的故障不会导致客户向 AIX 支持部门再次提出解决该问题的请求,这也称为二次故障数据捕获(Second Failure Data Capture,SFDC)。在 AIX 中,这个服务功能重点在于收集有关某个故障的足够信息,以允许实现全面的诊断而不需要故障重现。例如,AIX V5.3 ML3 引入的轻量级内存跟踪(Lightweight Memory Trace,LMT)支持代表了 AIX 首次故障数据捕获功能的重大进展,并为服务人员提供了功能强大和颇有价值的问题诊断工具。

运行时错误检查(Run-Time Error Checking,RTEC)工具为服务人员提供了操作已经内置在产品二进制文件中的调试功能的方法。RTEC 为服务人员提供了功能强大的首次故障数据捕获和二次故障数据捕获 (SFDC) 错误检测功能。这个 SFDC 服务功能将重点放在增强首次故障后的可服务性数据收集的工具上。基本的 RTEC 框架已在 AIX V5.3 TL3 中引入,并在后续的 AIX 版本中使用附加功能来进行了扩展。

IBM AIX 持续可用性战略

存在许多对持续可用性的市场需求,以解决典型的客户难点,包括:

太多计划的中断

服务依赖问题重现和干扰性的问题确定

系统不可用性中断了客户业务

对可靠的客户数据保护的需要

IBM 已使得 AIX 在持续可用性特征方面非常可靠,并且这种可靠性使得 IBM UNIX 服务器成为了市场中的佼佼者。IBM 的 AIX 持续可用性战略具有以下特征:

降低 AIX 系统中断(无论是计划内还是计划外的)的频率和严重度

通过增强 AIX 故障数据捕获工具来改进可服务性。

提供对调试和问题分析工具的增强。

确保提供所有涉及到计划外中断的必要信息,以便在客户付出最小努力的情况下校正问题

使用引入 System p 硬件的大型机硬件功能来实现操作系统持续可用性

通过硬件帮助来提供关键错误检测功能

利用其他 System p 硬件方面来继续进行到“始终在线”(stay-up) 设计的转变

使用“始终在线”设计来实现持续可用性

在面对错误的情况下维持操作系统可用性,同时最小化对应用程序的影响

使用完善和细粒度的操作系统错误检测和恢复功能

维持可服务性和可用性之间的强有力联系

在首次故障时捕获的数据基础上提供问题诊断,而不需要进一步的中断

提供不会对客户环境造成中断的服务帮助

提供整个服务器环境中和基本操作系统以外的端到端和集成的持续可用性功能

提供操作系统支持以及应用程序和存储对持续可用性环境的利用

本系列文章探索并解释了 AIX V5.3 中可用的持续可用性功能和增强,以及 AIX V6.1 中的新功能。其目标是提供对所有增强功能(包括对用户不直接可见和可见的增强功能)的总结性精确定义,并包括了命令的工作场景和了解某个主题所必需的背景信息。本系列文章是为负责服务器可用性的 AIX 专家编写的,无论他们是客户、业务合作伙伴还是 IBM 人员。

上一页  3 4 5 6 7 8 

Tags:IBM AIX 持续

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接