IBM AIX 持续可用性 (2)
2008-10-10 08:23:25 来源:WEB开发网系统被设计为使用许多方法来减轻该问题。例如,如果该数据从未实际使用,而只是被覆盖,则能安全地将该错误条件作废,系统将继续正常操作。
对于 AIX V5.2 或更新版本,如果某个进程实际引用了该数据来加以使用,则操作系统将收到该错误的通知。操作系统将仅终止与错误数据关联的特定用户进程。
AIX V6.1 的新增功能
POWER6 处理器添加了报告有关 SUE 机器校验的故障内存地址的能力。这个硬件特征与 AIX V6.1 恢复框架相结合,可以将 AIX 的恢复场景扩展到包括某些在内核模式下发生错误的情况。
明确地说,如果某个 SUE 发生在内核服务的 copyin() 和 copyout() 系列之一中,这些函数将返回错误代码,并允许系统继续操作(相反,在 POWER4 或 POWER5 系统上,AIX 将崩溃)。新的 SUE 功能将 SUE 的内核模式处理与 FRR 恢复框架集成在一起。
注意:缺省的内核恢复框架设置是禁用的。这意味着必须通过 SMIT 来采取启用操作,或者使用 raso 命令来启用恢复。当恢复未启用时,其行为与在 AIX 5.3 上相同。
自动化的系统挂起恢复
带错误检测和修复功能的自动系统挂起恢复是 AIX 的自动化系统管理的关键功能,这些功能可以检测高优先级进程独占系统资源并禁止正常执行的条件。AIX 为系统管理员提供了广泛的可自定义解决方案来对系统挂起条件进行补救。
恢复框架
从 AIX V6.1 开始,内核可以从所选例程中的错误中恢复,从而避免计划外的系统中断。内核恢复框架改进了系统可用性。该框架允许在发生某些意外的内核错误之后继续系统操作。
内核恢复
AIX V6.1 中的内核恢复缺省是禁用的。这是因为 AIX V6.1 中可恢复的错误集合非常有限,并且在启用内核恢复的情况下,每个线程将需要一个额外的 4K 内存页。要启用、禁用或显示内核恢复状态,可以使用 SMIT 路径 Problem Determination → Kernel Recovery,或者使用 smitty krecovery 命令。
您可以显示当前和下一次启动的状态,还可以在下一次启动时启用或禁用内核恢复框架。为了使更改完全生效,必须在更改内核恢复状态之后运行 /usr/sbin/bosboot 命令,然后重新启动操作系统。
在内核恢复操作期间,系统可能暂停短暂的时间,一般不到两秒钟。内核恢复操作之后将立即发生以下操作:
1. 系统控制台显示消息,说明已经进行了内核错误恢复操作。
2. AIX 向错误日志添加一个条目。
3. AIX 可能生成实时转储。
4. 您可以将错误日志数据和实时转储数据发送给 IBM 以获取服务(类似于在完全系统终止的情况下发送数据)。
注意:在内核恢复之后,某些功能可能会丢失,但是操作系统将保持稳定状态。如果有必要,可以关闭并重新启动系统以恢复丢失的功能。
- ››AIX 下 FTP 服务配置方法
- ››IBM WebSphere常见问题解答
- ››IBM WebSphere Studio V5相关认证资料
- ››IBM WebSphere应用服务器发展趋势
- ››IBM WebSphere Application Server诊断和调优(一...
- ››IBM WebSphere Application Server诊断和调优(二...
- ››IBM WebSphere Performance Pack服务器
- ››IBM WebSphere软件概述
- ››IBM PowerVM 实战手册,第 3 部分 : VIO server 配...
- ››IBM PowerVM 实战手册,第 2 部分 : VIO server 准...
- ››IBM p 系列服务器系统固件升级攻略
- ››IBM PowerVM 概述
更多精彩
赞助商链接