WEB开发网
开发学院操作系统Linux/Unix IBM AIX 持续可用性: 第 3 部分 阅读

IBM AIX 持续可用性: 第 3 部分

 2008-10-22 08:23:17 来源:WEB开发网   
核心提示:系统可靠性多年以来,AIX 操作系统一直包含由 IBM 技术支持的许多可靠性特性,IBM AIX 持续可用性: 第 3 部分,现在通过应用更先进的技术进一步提高了 AIX 的可靠性,其中一些新特性包括对 POWER6 存储键的内核支持、并行更新、动态跟踪和增强的软件初次故障数据捕捉等等,另外,在启用恢复框架时,错误检查

系统可靠性

多年以来,AIX 操作系统一直包含由 IBM 技术支持的许多可靠性特性,现在通过应用更先进的技术进一步提高了 AIX 的可靠性。其中一些新特性包括对 POWER6 存储键的内核支持、并行更新、动态跟踪和增强的软件初次故障数据捕捉等等。

错误检查

Run-Time Error Checking

Run-Time Error Checking(RTEC)让服务人员能够使用产品二进制代码中内置的调试功能。RTEC 提供强大的初次故障数据捕捉和二次故障数据捕捉错误探测特性。

基本的 RTEC 框架是在 AIX V5.3 TL3 中引入的,现在已经增加了更多的特性。RTEC 特性包括 Consistency Checker 和 Xmalloc Debug 特性。这些特性一般可以通过 errctrl 命令调整。

一些特性还有专门针对给定子系统的属性或命令,比如 sodebug 命令与新的套接字调试功能相关联。AIX 出版物中描述了增强的套接字调试功能,可以在以下站点上找到:

http://publib.boulder.ibm.com/infocenter/pseries/v5r3/index.jsp

内核堆栈溢出探测

从 AIX V5.3 TL5 开始,内核提供用来探测堆栈溢出的增强的逻辑。所有运行的 AIX 代码都维护一个称为堆栈的内存区,堆栈用来存储执行代码所需的数据。在代码运行时,堆栈会增长和收缩。堆栈可能增长到超过其最大的范围并覆盖其它数据。

这些问题很难解决。AIX V5.3 TL5 引入了一个异步的运行时检查功能,用来检查特定的内核堆栈是否溢出。探测到溢出时的默认操作是在 AIX 错误日志中记录错误。堆栈溢出运行时错误检查特性由 ml.stack_overflow 组件控制。

AIX V6.1 改进了内核堆栈溢出探测,支持用同步溢出探测功能保护某些堆栈。另外,在启用恢复框架时,以前属于重大问题的某些内核堆栈溢出现在是完全可恢复的。

1 2 3 4 5 6  下一页

Tags:IBM AIX 持续

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接