集群的可扩展性及其分布式体系结构(3)--下
2008-11-25 10:59:53 来源:WEB开发网作业管理
作业管理主要涉及任务派发、负载均衡和并行处理等功能。与传统工作站或PC结点不高的利用率相比,集群要达到系统的高利用率,作业管理软件必须提供这些功能功能。那么,在作业管理具体实现中,下面这些概念就显得非常重要了:什么是资源,什么是作业,作业有几种,如何衡量负载(Load),作业的运行包含哪些状态,每个状态又包含那些元素,等等等等,这一切都需要在集群系统中定义并加以体现。作业管理系统设计的好坏,直接关系到集群性能的高低。设计优良的作业管理和调度系统,其可扩展性要好于设计一般的集群,其影响性能的作用远远高于其他几类因素。我们将在随后的篇章里详细分析。
高效通讯
为集群,特别是松耦合的工作站集群建立一个高效的通信子系统比为MPP这样的紧耦合系统建立高效通信子系统更有挑战性。
因为集群有更高的结点复杂性,集群结点不能像MPP结点封装得那样紧密。而松耦合的集群应用相对普遍一些。
集群内结点之间物理线路的长度要长于MPP结点间的线路长度。即使是集中式的集群也是这样。长线路导致长的互连网络延时。但更重要的是,长线路有更多的可靠性、时钟扭斜和串道(cross-talking)等问题。这些问题要求用可靠的和安全的通信协议来解决,而协议又会增加系统开销。
集群一般使用有标准通信协议(如TCP/IP)的商品化网络(如:以太网,ATM)。商品化部件一般遵循Moore定律,但TCP/IP协议的系统开销很大。虽然低级通信协议比标准通信协议有效,但现在没有用于低级通信协议的统一标准。
追求高效往往和集群的可扩展性相抵触。想要高可扩展的集群系统,就要使用一些低效率的商品化网络,更通用的硬件平台,流行的操作系统。在保障了集群的可扩充能力的同时,不可避免的降低了优化性能的可能,采用Open Source的操作系统或许可以解决一些问题。
更多精彩
赞助商链接