【导读】 有两种典型的拓扑结构可以实现高可用性,被动备份服务器和第二活动服务器。我们将详细讨论第二活动服务器的三种实现形式:“全部复制”、“0共享”和“全部共享”......
集群是指物理上连接并紧密集成的两台或多台服务器,目的是提高可用性和可伸缩性。这些服务器即便不完全相同也十分相似,每台都能独立完成特定的任务。运行一个集群需要特殊的软件、硬件支持。
集群的优点
服务器集群典型运行在对可用性要求较高的安装中。并提供可伸缩性。即随着资源需求和负荷的增长,可以向集群系统添加更多的服务器。一般来说,只有企业级的系统和运行关键任务的环境才有这样的需求。
把可用性提高到大于99.9%的正常运作时间境界是通过提供可持续操作能力(即使某个服务器发生故障)来实现的。实际上,是通过把故障服务器上的应用程序转移到备份服务器上运行来实现的。许多典型的服务器拓扑结构可以实现这种“转移”恢复,在下几节中,我们将对之作出讨论。
可管理性的提高可以使系统管理员从某个中心位置就可以远程管理一个、甚至一组集群,就好象在单机系统中一样。企业级网络管理系统,如openview,还集成了其它一些管理能力,如在服务器间平衡负载或进行预防性维护时从某一服务器上手工卸掉某一应用等。
高可用性集群拓扑结构
有两种典型的拓扑结构可以实现高可用性,被动备份服务器和第二活动服务器。我们将详细讨论第二活动服务器的三种实现形式:“全部复制”、“0共享”和“全部共享”。
下表总结了本文讨论的几种面向可用性的集群方法的优点和局限性。
集群方法:优点与局限性
| 集群方法 |
描述 |
优点 |
局限性 |
| 被动备份服务器 |
只是在主服务器发生故障时,第二服务器才能投入运行,接管一切。 |
易于实现。 |
成本高。因为第二服务器不能处理其它任务。 |
| 活动的第二服务器 |
第二服务器也被用来运行任务处理。 |
成本低。因为第二服务器也能运行。 |
复杂性增加。 |
| “全部复制”方式 |
每个服务器都有自己的磁盘。主、次服务器之间不停进行数据拷贝。 |
高可用性和容错。适合于对可用性敏感的环境。 |
1. 拷贝操作使网络及服务器负荷很大。可能会有发生不同步的风险。有故障发生时,可能会有丢失事件。应用程序需要全面的修改。 |
| “0共享”方式 |
服务器连到相同的磁盘系上,但每个服务器都拥有属于自己的磁盘,如果某个服务器出错,它的磁盘将由另一服务器接管。 |
因为无需拷贝数据,所以降低了网络及服务器的一般运行开销。 |
通常需要磁盘镜象或RAID技术来补偿磁盘故障给系统带来的灾害。 |
| “全部共享”方式 |
多服务器可同时共享磁盘存取。 |
低网络及服务器运行开销。由于磁盘故障而引发系统停机的风险被降低 |
需要锁定管理软件;一般需要磁盘镜象或RAID技术。 |