在主机服务器上使用 VMware ESXi 可以最大化硬件,因为您可以在隔离的虚拟机 (VM) 上运行多个应用程序。然而,大多数用户需要更多的虚拟机,而在大多数情况下,这些虚拟机无法容纳在一台物理服务器上。这就是 VMware 集群的用武之地。
VMware 集群将多台物理服务器分组,并将它们作为一个单元进行聚合和管理,将它们视为一台机器。在服务器虚拟化中使用时,VMware 集群可解锁 vSphere 高可用性 (HA)、负载平衡和 VMware vSAN 功能。
通过 vSphere 集群获得灵活性
vSphere 集群是一组配置为共享处理器、内存、网络和存储等资源的 ESXi 主机。在 vSphere 环境中,每个集群最多可容纳 32 个 ESXi 主机,每个主机最多支持 1024 个虚拟机。
使用 vSphere 集群允许 IT 管理员在 VMware 环境中聚合和组织虚拟化资源,并将它们与底层物理资源相关联。假设一个集群包含三台物理服务器,每台都有四个运行频率为 8 GHz 的双核处理器和 16 GB 内存。
这样一个集群的总计算能力变为 192 GHz,而可用内存为 48 GB。使用此设置,您无需担心底层集群资源的物理组成。您所需要做的就是通过vCenter Server根据聚合的可用资源设置资源池策略。VMware 基础架构会自动将资源分配给这些策略范围内的虚拟机。
例如,市场部从192GHz、48GB的集群中预留128GHz、32GB,留给销售部64GHz、16GB。您为销售部门分配了 64 GHz 的计算能力和 16 GB 的内存这一事实并不意味着您不能即时调整它们的大小。
如果销售部门的工作量增加,您可以将其计算能力从 64 GHz 动态提升到 92 GHz。您还可以在不关闭关联 VM 的情况下将内存消耗从 16 GB 增加到 20 GB。为 VM 保留资源并不意味着他们立即离开营销部门。
当你拿走为市场部预留的32GHz,只有在市场部空闲的时候,它才会分配给销售部。当营销部门增加其容量时,它会自动带走其 32 GHz。以这种方式使用资源不会导致浪费,即使您为不同的池保留了它们。
使用 vSphere HA 实现高可用性
高可用性 (HA) 是一种系统特性,描述了其在不停机的情况下连续运行的能力。可用性通常表示为给定年份的正常运行时间(系统可用的总时间)与停机时间(系统不可用的总时间)之间的比率。
例如,流行的指标“五个九”,即 99.999% 的可用性,相当于一年中大约 5.26 分钟或更少的总停机时间。组织可以通过不同的方式实现 HA,包括冗余网络接口卡 (NIC)、HA 应用程序和服务器集群。
VMware 使用称为 vSphere HA 的许可功能在虚拟化层提供基础广泛且经济高效的高可用性。启用后,vSphere HA 会自动在具有备用容量的其他 ESXi 主机上重新启动出现故障的虚拟机。这最大限度地减少了服务中断和停机时间,同时消除了对昂贵的专用硬件和附加软件的需求。
虽然术语 vSphere HA 和 vSphere Fault Tolerance (FT) 经常互换使用,但它们的含义不同。vSphere HA 侧重于在高性能是重中之重的情况下实现尽可能短的停机时间。vSphere FT 还确保最短的停机时间,但并不专注于在系统故障事件期间提供高性能。
vSphere HA 利用 High Availability 集群(在同一网络上汇集的 ESXi 主机的逻辑分组)来防止 ESXi 主机、虚拟机和应用程序出现故障。可以在不同的 ESXi 主机上重新启动 VM,因为 HA 集群具有共享存储,用于维护集群内所有主机均可访问的虚拟机磁盘 (VMDK) 文件。
vSphere HA 使用称为故障域管理器 (FDM) 的功能,这是一种监控物理服务器可用性的代理。当您设置 VMware 集群时,vCenter Server 会将 FDM 代理放置在每个集群的 ESXi 主机上。集群中的一台 ESXi 主机成为主机,其他主机成为从机。Master 主机监控集群中 Slave 的信号,并与 vCenter Server 通信。
如果主控主机未能检测到来自 vSphere 环境中任何主机或虚拟机的信号,它会指示 vSphere HA 采取补救措施。如果整个主机出现故障,该硬件上的所有 VM 都会在集群中具有备用容量的其他服务器上重新启动。如果虚拟机出现故障,vSphere HA 会在集群中的其他主机上重新启动它。
使用 VMware DRS 管理集群资源
与 vSphere HA 一样,VMware Distributed Resource Scheduler (DRS) 是一项可授权的功能,您可以将其添加到 VMware 集群中。当您启用 VMware DRS 时,vCenter Server 使用其系统算法和您自己定义的规则来管理和优化集群资源。
VMware DRS将合并后的 CPU、内存和存储资源视为集群中所有虚拟机都可以访问的全局资源池。VMware DRS 根据集群内的资源分配策略智能地监控正在运行的虚拟机的工作负载及其在 ESXi 主机上的资源消耗。
如果特定工作负载违反了设定的策略,或者有改进的潜力,VMware DRS 会利用 VMware vMotion 动态地将 VM 重新分配给集群中的不同 ESXi 主机。
创建新 VM 时,如果启用了 DRS 功能,则无需指定主机。VMware DRS 自动收集集群中主机的详细信息和新 VM 的资源消耗详细信息,并生成放置建议。
这样,VMware DRS 提供了负载平衡和服务质量 (QoS) 功能。通过自动将 VM 迁移到不同的 ESXi 主机,VMware DRS 增强了 vSphere 环境中的性能。出于这个原因,大多数组织利用 VMware DRS 和 vSphere HA 来实现故障转移和负载平衡。
在故障转移的情况下,vSphere HA 会自动重启其他 ESXi 主机上的虚拟机,而 DRS 会智能地检查可用的计算资源以推荐集群内的虚拟机放置。