WEB开发网
开发学院操作系统Linux/Unix 系统管理员工具包: 监视运行缓慢的系统 阅读

系统管理员工具包: 监视运行缓慢的系统

 2008-11-12 08:12:40 来源:WEB开发网   
核心提示: 在多 CPU 系统中,您应该使用 CPU 数目加 1 来确定最大负载,系统管理员工具包: 监视运行缓慢的系统(3),例如,一个 4 CPU 的系统可以承受的最大平均负载为 5,对这些数据进行广播的需求可能也就意味着永远无法报告这些信息,这些数据可能过期, 通常在短时间内,计算机的平均负载可

在多 CPU 系统中,您应该使用 CPU 数目加 1 来确定最大负载。例如,一个 4 CPU 的系统可以承受的最大平均负载为 5。

通常在短时间内,计算机的平均负载可能比其最大平均负载高的多。例如,当构建或编译一个应用程序、或执行一项磁盘密集型任务时,平均负载可能会激增。这正是输出结果中包含 1、5 和 15 分钟平均值的原因,因为这样可以帮助消除任何瞬态负载极大值。

任何长时间的或未预料到的较高的值都可能表示存在问题,并且需要进行进一步的研究。如果这些数值较低,但系统却运行迟缓,那么可能表示存在交换空间的问题。

使用 ruptime

如果您管理着由许多系统组成的大型网络,那么有一种简单的方法来监视负载和网络中所有计算机的使用情况。ruptime 工具收集网络上所有计算机广播的数据,并将其集中到一个本地文件中,以便对所有计算机的当前状态进行检查。

例如,清单 1 显示了一个小型网络的输出结果:

清单 1. 一个小型网络的输出

$ ruptime
bear     up 10+09:13,   2 users, load 0.66, 0.68, 0.50
ultra3    up 6+01:16,   1 user,  load 0.00, 0.00, 0.00
atuin    down 4+00:52

最后一台计算机 11 分钟内没有报告任何数据,所以将其列为停机。

要生成这些信息,需要在本地网络中的每台计算机上运行 rwhod 守护进程(有时候是 in.rwhod)。这个守护进程为本地计算机广播信息,并收集来自所有其他计算机的广播数据。

因为 rwho/ruptime 系统的工作方式的原因,所以可能存在一些性能问题,尤其是在大型的网络中,它们生成的大量的系统报告和网络流量可能是有害的。在非常繁忙的系统中,对这些数据进行广播的需求可能也就意味着永远无法报告这些信息,这些数据可能过期,或者在系统繁忙时将其报告为停机。

上一页  1 2 3 4 5 6 7 8  下一页

Tags:系统 管理员 工具包

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接