服务器群集:Windows 2000 和 Windows Server 2003 常见问题(四)
2008-11-08 10:55:43 来源:WEB开发网服务器要求
问:可以群集多少服务器?
答:服务器群集中服务器的数量取决于 Windows 产品和 Windows 的版本。下表列出了服务器的数量:
Windows 操作系统 | 最大服务器数 |
Windows NT Enterprise Edition | 2 |
Windows 2000 Advanced Server | 2 |
Windows 2000 Datacenter Server | 4 |
Windows Server 2003 Enterprise Edition | 8 |
Windows Server 2003 Datacenter Edition | 8 |
问:服务器群集中的服务器是否必须一样?
答:群集兼容性测试并不要求合格的群集中的所有服务器都相同。随着群集规模的扩大,在硬件方面的投资也会增加,因此在一个群集中就可能会出现不同类型的服务器。
我们正在改进资格认定过程和列出过程,以便使不同解决方案的定义和认定更为方便。这对于 OEM 来说尤其重要,在 OEM 处服务器系列的更改相对频繁,因此使用目前的过程会大大增加额外要求的资格认定过程。在资格认定过程中服务器本身不会是什么问题,它通常是存储子系统的 HBA 或其他片断,因此没有什么理由要求在某个合格的解决方案中一定要使用相同的服务器。
问:可以在同一服务器群集中混合使用 32 位服务器和 64 位服务器吗?
答:不能,一个服务器群集中包含的所有服务器必须都是 32 位服务器或 64 位服务器。
问:任何服务器都可以用来创建群集吗?
答:所有合格的解决方案都会在位于以下网址的 Microsoft 硬件兼容性列表 (HCL) 中列出:http://www.microsoft.com/whdc/hcl/default.mspx. Microsoft 仅支持 HCL 上列出的群集解决方案。您可以使用配置中列出的任何服务器来构建一个完整的解决方案。
互连
问:群集互连要求什么类型的网络?
答:网络接口控制器 (NIC) 以及认证的群集配置中使用的任何其他组件都必须具有 Windows 徽标且包含在“Microsoft 硬件兼容性列表”中。互连本身必须支持 TCP/IP 和 UDP 流量,并且必须作为一个非路由 LAN 段或子网出现。
问:服务器群集支持直接通过 WinSock 实现的高带宽低延迟互连吗?
答:服务器群集代码本身不使用 WinSock 直接路径来实现群集内部通信。群集节点间的所有通信都通过 TCP/IP 或 UDP 实现。群集服务器可以在具备标准 NDIS 网络适配器 (NIC) 的节点之间使用高带宽低延迟连接(但可能无法利用高带宽低延迟的特点)。
问:一台群集服务器应配备多少个网络适配器?
答:群集节点必须与两个或多个独立的网络相连,以避免出现单一故障点。因此需要使用局域网 (LAN)。仅具有一个网络的群集配置是不受支持的。为进行群集通信,至少必须配置两个网络。通常,其中一个网络是专用网络,仅用于群集通信,另一个网络则是公共网络配置用于客户端访问和群集通信。
问:一个群集支持配置多块公共网络适配卡吗?
答:支持,但是有两个注意事项:
•每块网络适配器都必须位于不同的子网上。
•您可以创建不同的 IP 地址资源来关联不同的适配器;但是不能让一种资源或一个应用程序依赖于两个网络,以便在一个网络出现故障时,应用程序还可以继续工作。在服务器群集中,所有相关项都必须联机,相关的应用程序才能够联机。
在群集技术的未来版本中,我们正在对某个功能进行设计,以便可以实现更加灵活的相关性,例如:资源可以依赖于 A 或者 B 来实现其自身的联机。
问:一个群集可以支持多个专用网络吗?
答:可以。
问:为什么我看到网络上的心跳信号包被标记为“仅客户端”?
答:在 Windows 2000 及更高版本中,不管公共网络的配置如何,服务器群集软件的心跳信号都会通过公共网络和专用网络。这是为了确保群集服务可以检测到公共网络适配器的故障,并可以在当前承载应用程序的节点无法与外部通信时故障切换应用程序。
问:如何配置不同的网络?
答:群集节点必须与两个或多个独立的网络相连,以避免出现单一故障点。通常使用两个局域网 (LAN)。不支持节点仅连接一个网络的群集配置。
您应当将专用网络配置为“只用于内部群集通信”,将公共网络配置为“所有通信”。
问:群集网络上传送什么类型的信息?
答:群集服务对以下群集内部流量使用群集网络:
•服务器群集查询/管理和控制信息
•故障检测的心跳信号
•用以确保群集配置严格一致的群集内部通信
•某个节点重新启动或从故障中恢复时的群集加入请求
问:服务器群集中的应用程序支持什么类型的协议?
答:支持群集的应用程序必须使用基于 TCP/IP 的协议。群集软件仅支持在故障转移时使用 TCP/IP 协议。
问:如果某台服务器上的公共网络出现故障,是否会发生故障转移?
答:是的,在 Windows 2000 及更高版本中,会在公共网络中发送额外的心跳信号,以检测公共网络和/或 NIC 故障,并在当前承载应用程序的节点不能与其他节点进行通信时,进行应用程序故障转移。
问:服务器群集中是否支持 NIC 组?
答:是的,但是有一些注意事项。不支持同时在所有群集网络上使用 NIC 组。最少会有一个支持群集节点间的内部通信的群集网络不能成组。通常,这个不能成组的网络就是专用于连接这类通信的网络。在其他群集网络上使用 NIC 组是可以接受的;但是,如果某个成组网络中出现通信问题,Microsoft Product Support Services 可能会要求禁用该组。如果此操作可以解决问题,那么您必须向成组解决方案的提供商寻求更进一步的帮助。
问:服务器群集虚拟服务器支持 DHCP 吗?
答:不支持,虚拟服务器必须具有静态 IP 地址。
问:服务器群集节点支持 DHCP 吗?
答:支持,可以通过 DHCP 向物理节点动态分配地址,但我们建议人工配置静态地址。
问:运行服务器群集要求使用 NetBIOS 吗?
答:在 Windows NT 和 Windows 2000 中,为使服务器群集正常工作,需要使用 NetBIOS。
在 Windows Server 2003 中,群集服务不要求使用 NetBIOS,但是如果禁用 NetBIOS,一些服务将会受到影响。您应当知道:
•默认情况下,在配置群集时,在群集的“IP 地址”中是启用 NetBIOS 的。在创建群集后,您应当通过取消选中“群集 IP 地址”资源的参数页上的复选框来禁用 NetBIOS。
•在创建其他 IP 地址资源时,您应当取消选中 NetBIOS 复选框。
•在禁用 NetBIOS 时,您将不能使用群集管理器中的“浏览”功能。群集管理器使用 NetBIOS 来枚举给定域中的所有群集。
•“打印和文件”服务被禁用 不会有任何虚拟名称被添加为重定向器终结点。
•
如果指定群集名称,则“群集管理器”将无法工作。 cluadmin 调用 GetNodeClusterState,后者使用远程注册表 API,注册表 API 则根据虚拟名称使用命名管道。
问:服务器群集中是否支持 IPSec?
答:尽管可以对能够在服务器群集中进行故障转移的应用程序使用 Internet 协议安全 (IPSec),但 IPSec 并非专为故障转移而设计,因此我们推荐您不要对服务器群集中的应用程序使用 IPSec。
问:服务器群集如何在进行 IP 故障转移时更新路由表?
答:作为自动恢复过程的一部分,群集服务会向路由器发出 IETF 标准 ARP“刷新”命令来刷新与正在被迁移到其他服务器的 IP 地址关联的机器地址 (MAC)。
问:“地址解析协议”(ARP) 如何导致 LAN 上的系统更新它们的将 IP 地址转换为物理机器 (MAC) 地址的表?
答:ARP 规范规定所有收到 ARP 请求的系统都必须更新请求源的物理地址映射。请求中包含源 IP 地址和物理网络地址。作为 IP 地址注册过程的一部分,Windows TCP/IP 驱动程序会在相应的 LAN 上广播几次 ARP 请求。这种请求要求指定 IP 地址的所有者以其物理网络地址作为响应。通过向正在注册的 IP 地址发出请求,Windows 可以检测到 IP 地址冲突;如果可以收到响应,那么就不能安全地使用这个地址。可是,在它发出这个请求时,Windows 会将这个正在注册的 IP 地址指定为请求的源。因此,网络上的所有系统都会将它们的 ARP 缓存项更新为指定地址,从而使得正在注册的系统成为这个地址的新的所有者。
请注意,如果发生地址冲突,响应系统可能会针对相同的地址发出另一个 ARP 请求,从而再次强制子网上的其他系统更新它们的缓存。当 Windows 检测到一个已成功注册的地址存在地址冲突时,它就会执行上述操作。
问:服务器群集使用 ARP 广播来重新设置 MAC 地址,但是 ARP 广播不能通过路由器。那么如果客户端位于路由器后面又会怎样呢?
答:如果客户端位于路由器后面,它们会使用路由器来访问群集服务器所在的子网。相应地,客户端会使用它们的路由器(网关)通过指定的任何路由(OSPF、RIP,等等)将数据包传递到路由器。最终结果就是它们的数据包被转发给与群集同在相同子网上的路由器。这个路由器的 ARP 缓存与故障转移期间修改过的 MAC 地址一致。因而数据包能够到达正确的虚拟服务器,远程客户端甚至看不到原来的 ARP 广播。
存储
有很多存储问题,这些问题被分为一般问题、有关在存储区域网络 (SAN) 上部署服务器群集的问题以及网络附加存储 (NAS) 问题。
一般存储问题
问:服务器群集支持什么存储互连?
答:群集服务器不限制所支持的存储互连类型;但是,从实际的角度看来,有一些对存储子系统的要求会限制所支持的存储互连类型。例如,所有群集节点都应该能够访问存储设备。通常这会影响互连,因为只能使用支持多个发起人(比如说节点)的互连。目前 HCL 上的合格配置中包含的互连有:SCSI(多种不同的 flavor)、光纤通道仲裁回路以及光纤通道交换结构。
请记住,Microsoft 仅支持所有配置都出现在“群集 HCL”上的群集。
问:如何配置 SCSI 群集上的节点和存储?
答:您必须确保所有在 SCSI 总线上的设备都具有不同的 SCSI Id。默认情况下,SCSI 适配器会具有 Id 7。您应当确保每个节点中的适配器都具有不同的 Id。同样地,也应当在总线上为磁盘分配唯一的 SCSI Id。
为了使 SCSI 总线能够正常工作,必须中止它。有很多方法可以终止总线,使用内部方法(在主机适配器)和外部方法(使用 Y 线缆)都可以。为确保群集可以在不同类型的故障情况下存活(具体说来就是可以关闭其中一个节点),必须使用被动组件(例如 Y 线缆)来终止 SCSI 总线。内部终止,要求启动适配器,不推荐使用这种方法。
注意:使用 SCSI 存储互连时,Microsoft 仅允许构建 2 节点群集。
问:服务器群集支持光纤通道仲裁回路 (FC-AL) 吗?
答:支持,使用 FC-AL 存储互连时,Microsoft 仅允许构建 2 节点群集。不支持多个群集位于一个光纤通道回路上。
问:多个群集可以连接到相同的存储控制器吗?
答:可以,如果有多个群集连接到相同控制器的话,会有一些专门针对存储控制器的设备规范测试,用于确保它们可以正确响应。为了使多个群集可以连接到相同控制器,该存储控制器必须出现在多群集设备“硬件兼容性列表”(HCL) 中,并且每个端到端群集解决方案都必须出现在“群集硬件兼容性列表”中。例如:EMC Symmetrix 5.0 就位于多群集设备 HCL 列表中。只要 Dell PowerEdge + EMC Symmetrix AND Compaq Proliant + EMC Symmetrix 都位于群集 HCL 中,多个群集(假设是一个 Dell PowerEdge 群集和一个 Compaq Proliant 群集)就可以连接到 EMC Symmetrix 存储控制器。
问:如果从主机总线适配器 (HBA) 上拔下存储电缆,会不会发生故障转移?
答:如果从主机总线适配器 (HBA) 上拔下存储电缆,在适配器对连接丢失作出反应之前可能会有一个停顿,但是,一旦 HBA 检测到通信失败,那么群集内使用这个 HBA 的磁盘资源也会失败。这将会触发一次故障转移,从而在群集中的其他节点上重新使资源联机。
如果重新连接存储电缆,Windows 操作系统可能无法自动重新扫描新硬件(取决于适配器的驱动程序)。您可能需要人工重新扫描新设备。在执行重新扫描之后,该节点就可以承载任何物理磁盘资源了。如果设置了故障回复策略,则拔下电缆时被故障转移的任何资源都会在重新连接电缆时故障回复到该节点。
注意:HBA 是部署在服务器中的存储接口。通常这是一个将服务器连接到存储结构的 PCI 卡。
问:服务器群集能保护我的磁盘免于出现硬件故障吗?
答:不能,群集服务器可以在服务器故障、操作系统或应用程序故障以及系统停机期间(由于维护)提供保护。Microsoft 强烈建议使用硬件或软件中提供的冗余技术(例如镜像、RAID 或复制)来防止应用程序和用户数据由于磁盘故障而丢失。
问:服务器群集支持 RAID 或镜像磁盘吗?
答:是的,Microsoft 强烈建议使用硬件或软件中提供的冗余技术(例如镜像、RAID 或复制)来防止应用程序和用户数据由于磁盘故障而丢失。
问:群集中支持动态磁盘吗?
答:Microsoft 的 Windows 服务器产品不支持在服务器群集环境中使用动态磁盘。Veritas 的 Volume Manager for Windows 2000 加载项产品可用于在服务器群集中增加动态磁盘功能。如果在群集中安装了 Veritas Volume Manager 产品,则 Veritas 应成为群集问题的首个支持点。
问:可以在不重新启动的情况下扩展群集磁盘吗?
答:可以,如果存储控制器支持基础物理磁盘的动态扩展,那么就可以在不重新启动的情况下扩展群集磁盘。很多新的存储控制器虚拟了向操作系统呈现的逻辑单元 (LUN),这些控制器允许从存储控制器管理控制台中联机增大 LUN。Microsoft 提供了一种称为 DiskPart 的工具,使用它可以在不中断正在使用磁盘的应用程序或用户的情况下联机增大卷或分区,以便利用磁盘上新创建的空间。Windows 2000 和 Windows Server 2003 分别使用不同版本的 DiskPart。Windows 2000 版 DiskPart 可以通过 web 免费下载,而 Windows Server 2003 版 DiskPart 则是随分发媒体一起提供。
注意:LUN 等同于可以在“磁盘管理器”中看见的一个磁盘设备。
问:在不重新启动的情况下其他磁盘可以添加到群集中吗?
答:可以,您可以插入一个新磁盘或是创建一个新 LUN,并使群集节点可以看到该磁盘或 LUN。您应当只让群集中的一个节点可以看到该磁盘,然后再创建群集资源来保护这个磁盘。一旦磁盘获得保护,您就可以让群集中的其他节点可以看到该 LUN。在某些情况下,您可能需要在设备管理器中执行一次重新扫描,以便发现新设备。在另外一些情况下(尤其是使用光纤通道时),系统可能会自动检测到磁盘。
问:在不重新启动的情况下可以从群集中移除磁盘吗?
答:可以
问:什么类型的磁盘可以用作群集磁盘?
答:Microsoft 建议将群集磁盘上的所有分区都格式化为 NTFS 文件系统。有两个原因。首先,NTFS 提供了访问控制,可以用来保护磁盘上的数据。其次,NTFS 可以从被强行卸载的卷中恢复;而如果强行卸载其他文件系统,这些文件系统可能会遭到破坏。
服务器群集仅支持“主引导记录”(MBR) 格式磁盘。群集磁盘的格式不能是 GPT。
问:可以将磁盘设备或其他非磁盘设备作为“群集磁盘”连接到同一存储总线吗?
答:这取决于存储互连。服务器群集使用 SCSI 来保留和重新设置群集磁盘的仲裁。在 Windows NT 和 Windows 2000 中,群集服务器执行一种无目标的总线重设。在 Windows Server 2003 中,有可能确定重设,但是,它可能会故障回复到无目标的重设。如果磁带设备收到重设,这通常会触发磁带倒带。
服务器群集没有为对多台服务器可见的磁带设备提供任何仲裁机制,因此磁带设备无法防止多台服务器的并发访问。
在使用 SCSI 群集或回路以及光纤通道仲裁回路时,Microsoft 不支持将磁带设备连接到包含群集磁盘的 SCSI 总线。
只要磁带设备对于群集磁盘的适配器不可见,就可以将它们连接到交换结构。这可以通过将磁带放到群集磁盘的不同区域或是通过 LUN 屏蔽技术来实现。
问:服务器群集中支持软件容错磁盘(软件 RAID 或镜像)吗?
答:Microsoft 的 Windows 服务器产品不支持软件 RAID 或镜像,但是有一些第 3 方产品可以在群集环境中提供此功能。
问:服务器群集中支持“虚拟快照服务”(VSS) 吗?
答:是的,“虚拟快照服务”是 Windows Server 2003 中的新功能,它提供了基本的快照功能,备份应用程序可以使用这些功能来创建连续的单个时点备份。群集服务具有一个 VSS 提供程序,使用这个提供程序可以拍摄群集服务配置,然后这些备份程序会将所拍摄的快照作为系统状态的一部分存储。
问:服务器群集中支持 Timewarp 快照吗?
答:不支持,Timewarp 是 Windows Server 2003 中提供的一项新功能,使用这项功能可以拍摄连续的快照,并将这些快照公开给客户端。TImewarp 可以利用不支持群集的功能,但目前还不支持在群集中使用 TImewarp。
问:服务器群集支持硬件快照或事务恢复卷吗?
答:支持,您可以使用最新的存储控制器中的一些工具来创建现有卷的快照。但是请注意,在您创建磁盘快照时,不应将该快照公开给原始磁盘所在的群集。群集服务使用磁盘签名来唯一标识磁盘。使用快照时,磁盘和快照具有相同的磁盘签名。
如果您创建了群集磁盘的硬件快照或事务恢复卷,则应当将此快照公开给其他服务器或群集(通常是专用的备份服务器)。
问:在创建群集磁盘时还应考虑什么事项?
答:现代的存储控制器本身都提供一个虚拟的存储视图。一个物理 RAID 组可以被划分成多个逻辑单元,并以单个磁盘或 LUN 的形式公开给操作系统。如果您想要按此方法划分物理磁盘,并以单个 LUN 的形式向主机公开它们,您就应当谨慎考虑 IO 特点和故障特点 请记住,对于每个心轴只有固定的带宽。
Microsoft 建议您不要创建 LUN,并将其用作与将要用于应用程序的基础物理磁盘相同的仲裁磁盘。仲裁磁盘的可用性直接关系到群集的可用性。如果到仲裁磁盘的 I/O 花费太长时间,群集服务器将会认为仲裁磁盘已失败,并启动仲裁设备的故障转移。此时,与群集有关的所有其他活动都将被挂起,直到仲裁设备重新联机为止。
问:如何替换群集中出现故障的磁盘?
答:替换办法取决于 Windows 的版本:
•Windows NT Enterprise Edition
•使用 FTEdit 工具,并对注册表进行一些操纵。这个办法已在 KB 文章243195
•Windows 2000
•DumpCfg。
•Windows Server 2003 Reskit 中提供的 ClusterRecovery Reskit 工具。
•Windows Server 2003
•自动系统恢复。
•ConfDisk。这个办法已在 KB 文章280425
•Windows Server 2003 Reskit 中提供的 ClusterRecovery Reskit 工具。
更多精彩
赞助商链接