|
简介
电能的使用不是数据中心的典型设计标准,也没有作为一项开支得到有效管理。在数据中心的生命周期内,尽管电能成本可能会超过包括 UPS 在内的电源系统的成本,也可能会超过 IT 设备的成本,但上述情况却是不争的事实。出现这种情况的原因如下:
· 要缴纳的电费数额是在费用发生后才知道的,与任何特定决策或操作规程没有明确的联系。因此,这些费用被视为是无法避免的。
· 用于为数据中心的电力成本建模的工具不普及,在数据中心的设计过程中并未广泛使用。
· 需要缴纳的电费通常不包括在数据中心运营组的责任或预算范围内。
· 数据中心的电费帐单可能包含在更大的电费帐单之内,而可能无法单独提供。
· 决策者在进行规划和采购决策的过程中,未获得有关电力成本影响的充足信息。
本白皮书将证明上述所有问题均可以并应该得到解决,因为这样可以为一般用户节约大量资金。在设计新设施时可以实现最大程度的节约,但现有的和改造的设施也可以实现某种程度的节约。在设计新数据中心的过程中,只需进行简单且不需成本的决策,便可以节约 20-50% 的电费;如果系统化进行设计,则可以减少多达 90% 的电费。
什么是电能消耗成本?
电能成本通常为每千瓦时 0.12 美元。根据这一成本,每千瓦 IT 负载的年电力成本约为 1,000 美元。在典型数据中心的 10 年生命周期中,这大约相当于每千瓦负载 10,000 美元的成本。
通常,数据中心所使用的能源约有一半消耗在 IT 负载上。另一半消耗在包括电源设备在内的网络关键物理基础设施 (NCPI) 设备上。这意味着,对于每千瓦 IT 负载,10 年的电力成本约为 20,000 美元。例如,一个 200 千瓦的数据中心 10 年的电能,成本为 4,000,000 美元。这对于任何组织都是一项巨大的成本,所有 IT 专业人员都应了解这项开支的去向,并知道它是可以避免的。
能源消耗在什么地方?
数据中心使用的能源只有大约一半甚至不足一半消耗在 IT 负载上。另一半消耗在包括电源设备、冷却设备和照明设施在内的网络关键物理基础设施 (NCPI) 设备上。图 1 显示了典型高可用性数据中心中电能的流向。需要注意的是,数据中心消耗的所有能源最终都会以废热的形式排放到室外大气中。图 1 是根据采用 2N 电源设备和 N+1 冷却设备、在大约 30% 的额定容量下工作的典型数据中心。
图 1 – 典型数据中心的电能流向
根据输入电能中实际消耗在 IT 负载上的比例,上述数据中心的效率为 30%。若要更详细地了解电能消耗在什么地方,以及不同类型的设备具有什么样的负载,请参阅 APC 113 号白皮书“数据中心的电力效率建模”。
效率并不是有效的指标
许多有关电能消耗的讨论中都使用“效率”一词。虽然能够准确理解诸如“提高效率”等此类词汇的基本含义,但在技术上使用“效率”一词对数据中心进行定量评估则会引起混淆。如果使用电能消耗(千瓦)指标而不是效率指标,则会使讨论变得明确得多。例如,如果数据中心内两台不同设备的效率分别为 50% 和 80%,那么我们不知道如何将其效率合并为一个体现成本的数字。事实上,电力成本实际取决于流经每台设备的电量。而且,某些设备(如计算机或照明设施)的效率为零,这是一个令人困惑的概念,没有传达出有关用电量的定量信息。
相比之下,以电能消耗为指标简单明了。只要将数据中心内所有设备的能耗加在一起,即可得出总耗电量。如果一台设备每个月消耗 10 美元的电能,而另一台设备每个月消耗 20 美元的电能,只要将这两个值加在一起就可以了。因此,
本白皮书使用电能消耗作为定量术语,而不使用更常见但不明确的“效率”一词。有关对数据中心能源消耗进行建模的完整讨论,请参阅 APC 113 号白皮书。
一瓦特的价值
电能以称为千瓦时 (kW-hr) 的能量单位进行销售,它是在 1000 瓦 (1 kW) 的功率水平下一小时内提供的能量。功率与能量之间的区别对于经济分析非常重要。功率容量成本是指与提供能量的系统相关的成本,并随系统的设计功率水平提高而增加。由功率容量产生的成本有很多,例如 UPS 成本、发电机成本、空调设备成本和配电设备成本。能源成本是指与市电帐单相关的成本。
需要了解的一条关键原理是,通过降低能源消耗可以降低与功率容量相关的成本以及能源成本。也就是说,如果一种实施方法在许多情况下可以节约电能,则它也能够减少 NCPI 基础设施成本(主要由负载功率需求引发)。需要了解的另一条相关的关键原理是,暂时性降低能源消耗与永久性降低能源消耗是不同的。暂时性节约(例如减负载或服务器电源管理)可以降低电力成本,但未必降低 NCPI 系统的额定功率和相关的 NCPI 基础设施成本。永久性或结构性更改(如高效率服务或高效率 UPS 系统)可同时降低电力成本和基础设施成本。表 1 中阐释了这些原理并给出了节约价值的示例。
表 1 – 典型高可用性数据中心
在上面的示例中,数据中心采用 2N 冗余结构,并在典型的 30% 负载下工作。需要注意的是,对于非冗余数据中心,节约效果会大打折扣,仅为上面所示的节约额的一半左右。还应注意的是,在一般情况下,进行结构性削减并不能消除所有已安装的电源和冷却容量的需求,因此节约效果还会进一步降低。不过,总的来说,可以将结构性节能的效果合理地估计为暂时性节能的两倍。
此处应该了解的重要一点是,能源消耗降低有两种形式:一种是只避免能源消耗,但不会降低功率容量需求;另一种是也会降低安装的功率容量。我们将可避免使用能源但不降低安装功率容量的节能称为“暂时性节能”,将可降低安装功率容量的节能称为“结构性节能”。另外,数据中心的一个普遍规则是,结构性节能效果约为暂时性节能的两倍。
IT 设备能源消耗的降低
显而易见,能耗主要来自 IT 设备的电能开销。IT 设备的能耗直接导致电费开支,并由于要求配备同样消耗相应电量的各种电源和冷却设备而导致间接的电费开支。因此,所有 IT 人员均应注意控制 IT 设备的能耗。
用于控制 IT 能耗的手段一直以来都效果不佳。例如,IT 设备供应商没有提供充分的信息,而使用户无法根据用电量作出决策。用户通常不知道他们可以有不同的 IT 选择,相应的能耗也不同。不过,情况正在好转,用户现在可以从运营和规划两方面入手,系统化地降低能耗。
降低 IT 系统能耗有多种方法:
· 运营措施:淘汰某些系统、以高效的方式使用现有系统,以及迁移到更节能的平台
· 规划措施:虚拟化和标准化
下面依次讨论每种方法。
运营措施:淘汰某些 IT 系统
大多数数据中心仍有旧的技术平台处于运行中,供进行存档或研究之用。实际上,大多数数据中心都有一些应用服务器在运行,但根本没有用户。盘存这些系统并制定淘汰计划是很有用的。在许多情况下,即使系统没有实际淘汰,也可以使其脱机并关闭。
一种相应的方法是,将多个旧技术平台上的应用合并到新服务器上,从而大幅度减少服务器总数。这种类型的合并不需要虚拟化,这将在后面加以讨论。
一般情况下,可以降低多达 20% 的能耗。即使未减少占地面积,但因用户部署的 IT 设备密度更高,恢复的功率容量也非常可观。
运营措施:以高效的方式使用现有系统
如今,大多数新服务器都具有电源管理功能。也就是说,它们可以在计算负载下降时降低能耗。这在几年前是不可能的事情,那时,几乎所有 IT 设备的能耗都是恒定不变的,且与计算负载无关。用户应当了解 IT 技术的这一变化,并了解其 IT 系统上电源管理功能的状态。在可能的情况下,应在具有电源管理功能的所有设备上启用该功能。需要注意的是,许多设备制造商提供的设备在默认情况下禁用这些功能。这可能需要升级应用程序,以确保其最大程度地利用电源管理功能。电源管理功能可以降低总用电量,但不能降低功率容量需求。
运营措施:迁移到更节能的计算平台
迁移到电力效率更高的平台是降低能耗的另一种有效策略。大多数数据中心都有已投入使用 3 至 5 年的所谓“低密度服务器”。通常,这些服务器每台消耗的电能与如今的刀片式服务器相当或更低,而每台的体积要大得多。从传统服务器逐台迁移到现代的刀片式服务器通常并不能降低总能耗,甚至有可能增加能耗。不过,这种迁移可以实现高得多的服务器组合密度。刀片式服务器产生的热量并不比同等的 1U 服务器多,但产生热量的面积更小,这会导致排热问题,因此会使人觉得刀片式服务器产生的热量过多。
在规划新服务器部署时,使用刀片式服务器而非其他形式的服务器通常会降低 20% 的能耗。这是因为通常刀片式服务器的电源效率更高,并且能够共享某些开销功能,如风扇。需要了解的是,与其他服务器形式相比,在新部署设备时选择刀片式服务器形式可以降低能耗,但刀片式服务器的能耗并不一定比旧服务器低。
通过上述讨论可以看出,从现有服务器技术进行逐台服务器的迁移并不一定会明显降低能耗。若要确定通过逐台迁移到刀片式服务器来节能的可能性,应该将现有服务器的能耗与所提议的任何刀片式服务器的能耗进行比较。而且,还应比较两种服务器的性能,以便用每瓦性能指标加以衡量。如今,主要的 OEM(例如 Dell、HP 和 IBM)均为用户提供配置工具,这些工具可以准确地报告各种刀片式服务器配置的实际能耗。若要确定传统服务器的能耗值,唯一现实的方法是使用瓦特计测量示例服务器的能耗。通过比较以这种方法获得的值,可以估算出大型服务器迁移的节能效果。不过,以下迁移策略通常是最有效的:
· 用一台双向服务器或一台单处理器双核服务器替换 2 台或更多旧服务器
· 用一台基于低电压或中电压处理器的刀片式服务器替换一台旧服务器
· 对于具有专用磁盘驱动器的服务器,用低功率企业级 2.5 英寸驱动器替换 3.5 英寸驱动器
· 用一台双核处理器服务器替换一台双处理器服务器
· 用一台双向双核服务器替换一台四向服务器
通过上述讨论可以看出,迁移通常并不是降低能耗的最有效手段。至于新服务器技术帮助降低能耗的主要方法,一是通过合并服务器上的应用来减少服务器总数,二是对服务器进行虚拟化。
规划措施:虚拟化
服务器虚拟化可大幅降低 IT 功率需求。虚拟化几乎总是能够大幅度减少所安装的服务器数量。消除一台服务器可以产生约 200 至 400 瓦的结构性节能,具体取决于所使用的技术。因此,每消除一台服务器,每年可节约能耗约为 380 美元,这一结构性节约在 10 年内节约的总 TCO 成本约为每台服务器 7,680 美元。这一节约数额明显大于服务器本身的成本。
规划措施:标准化
即使未使用虚拟化,对节能服务器实行标准化也是一种非常有效的方法。如今,刀片式服务器是电力效率最高的服务器形式。不过,一个刀片式服务器系统可以使用的刀片形式在性能和能耗方面差异巨大。基于服务器的应用的性能需求往往难以事先预测,因此,用户往往会以大量增加能耗为代价来指定尽可能高的性能。
如果服务器已经虚拟化,那么使用性能最高的服务器的策略一般是最大程度地降低总体能耗的最佳途径。不过,如果根据应用来部署服务器,则应当使服务器的性能与应用需求相匹配,这样才可以做到节能。
对于对刀片式服务器系统实行标准化并根据应用来部署服务器的用户,可以选择对两台刀片式服务器实行标准化,即一台高性能/高功率刀片式服务器和一台低性能/低功率刀片式服务器。能耗范围可以大于 2:1。合乎逻辑的策略是,默认情况下,在低性能刀片式服务器上部署应用,而仅在需要时,才迁移到高性能刀片式服务器上。刀片式服务器便于预配置,这使上述过程变得很容易。通过这种方式,典型的商业数据中心可以节约 10% 或更高的结构性 IT 负载能耗。
NCPI 设备能源消耗的降低
通过以下技术可以降低 NCPI 设备的能源消耗:根据负载适度规划 NCPI 系统的规模,使用高效的 NCPI 设备,以及设计节能的系统。在采购过程中,用户可能会对 NCPI 设备的电力效率有所了解,但实际情况是,制造商提供的数据一般不足以用来确定实际的能源消耗差异,而且,与选择合适的 NCPI 设备相比,适度规划系统规模和系统设计两者对耗电量的影响都要大得多。
适度规划规模
在可供用户使用的所有方法中,根据负载适度规划 NCPI 系统的规模对 NCPI 的耗电量影响最大。大多数用户都不知道,不管是否存在 IT 负载,电源和冷却系统中都存在固定的损耗,而且这些损耗与系统的总额定功率成正比。在典型安装中,这些固定损耗是 NCPI 耗电量的主要形式。在 IT 负载很小的安装中,NCPI 设备的固定损耗通常会超过 IT 负载。一旦 NCPI 系统规模过大,固定损耗占总电费的比例就会提高。对于其负载仅为额定负载的 30% 的典型系统,每千瓦 IT 负载每年的电力成本约为 2,300 美元。如果根据负载适度规划系统的规模,每千瓦 IT 负载每年的电力成本降至大约 1,440 美元,电力成本节约 38%,如表 4 所示。
表 4 – 适度规划数据中心的规模所带来的经济效益
需要注意的是,除了电力节约外,适度规划规模还可以产生每千瓦 IT 负载每年 1,400 美元的 NCPI 投资成本和运营成本节约,几乎与电力节约相当。这些是特定示例的潜在节约量,实际节约量将会有所变化,对于非冗余系统可能较此为低。
在实际安装中,适度规划规模有可能减少多达 50% 的电费开支。适度规划规模所具有的突出经济优势是业界纷纷采用模块化、可扩充的 NCPI 解决方案的主要原因。
节能的系统设计
许多用户都认为,系统的电力消耗受各个组件的效率控制,因此降低能耗的主要方法是提高各个设备的效率。这种看法十分经不起推敲。系统设计对数据中心的电力消耗具有巨大的影响,由相同设备组成的两个数据中心的电费开支可能会有明显的不同。因此,系统设计在决定数据中心效率方面所起的作用甚至超过了电源和冷却设备的选择。
下面是一些系统设计问题示例,这些问题通常会使数据中心的效率降至比各个部件的损耗之和低得多的程度:
· 配电装置和/或变压器在比其满负载容量低得多的状态下工作。
· 空调以低温输出并连续对空气除湿,而后必须使用加湿器连续对空气重新加湿。
· 在同一房间中一些空调在制冷,而另一些空调同时却在加热。
· 空调被迫顶着高压长距离输送空气,以至消耗过多的电能。
· 空调的回风温度比 IT 设备排气温度低得多,导致空调效率和容量降低。
· 冷却泵通过节流阀来调整流量,这大幅降低了泵的效率。
请注意,本列表的主要内容是与空调有关的设计问题。实际上,造成电能浪费的大多数不良设计实践均与空调有关,因为电源系统的架构更为标准化,因此比较不容易出现设计错误。
上述简表中的问题通常会使数据中心在 NCPI 上的能耗为所需的两倍。而且,只需通过简单的设计决策便可避免所有这些问题,所需开支甚少,或无需任何开支。有两种方法可以避免出现这些问题:
1) 确保方案经过完善的设计和测试以避免出现上述问题,包括复杂的计算液体动力学建模和全面的试运行测试;
2) 根据标准化设计获得完整的 NCPI 系统,包括预先设计、预先测试并指定规格的模块,以避免出现上述问题。
由于第一种方法成本极高且极为多变,因此,上面的第二种替代方法将成为将来规划和建设数据中心的标准方法。
使用高效的 NCPI 设备
尽管与 IT 架构、NCPI 适度规划或 NCPI 系统设计相比 NCPI 设备(比如电源和冷却设备)的选择对系统总耗电量的影响较小,但在设计节能高效的数据中心时,设备的选择仍然是一个重要因素。
即使是在相同条件下运行的相同类型的 NCPI 设备,彼此的电力损耗也存在巨大差异。例如,美国电力研究所 2005 年 12 月的一篇论文称,在 30% 额定负载条件下工作的不同 UPS 系统的损耗介于 4% 到 22% 之间,相差达 500%。必须加以注意的是,这一差异无法根据这些产品的规格表加以确定。本白皮书和 APC 的其他白皮书清楚地表明,只有使用适当的模型,才能正确预测实际应用中的电力损耗;同时还表明,一般制造商的数据不足以定量预测数据中心的电力消耗。APC 108 号白皮书“Making Large UPS Systems More Efficient”中提供了一个有关如何正确比较两台 NCPI 设备的电力消耗的示例。
降低总能源消耗的可行方法
本白皮书阐述了电力消耗问题的复杂性,并提供了各种降低能耗的策略。结合这些方法,可以总结出经过了降低电力消耗优化的数据中心与采用典型设计的数据中心相比,有可能实现的节约。
表 5 总结了 10 条可用于降低电能消耗的有效策略,并给出了与典型数据中心相比能够实现的节约幅度。这些策略适用于新数据中心,其中一部分还可以立即或在经过一段时间后部署到现有的数据中心。
上述表 5 摘要介绍了一些可降低数据中心电能消耗的最有效且实用的手段。节能量是根据 APC 113 号白皮书(本白皮书前面已引用过)进行的能量计算估算出的,适用于各种数据中心设计。除了该列表中的项目外,还可以使用本白皮书前面提到的其他复杂的 IT 架构策略。
上述某些节约措施可以在供应商提供的设备本身中实现,但大部分都与系统设计和安装有关。一些供应商提供预先设计的标准化系统设计,这些设计已经过优化和验证,具有高效;请向您的供应商咨询。对于使用现有设施并寻求降低电力消耗的用户,客户可以尝试按照上面提供的指导去做,也可以求助于一些供应商(如 APC),他们使用专为数据中心设计的专门工具和方法提供数据中心能源效率评估服务。
结论
数据中心的电力成本是一项巨大的运营成本,这一成本可以管理,也应该加以管理。进行了降低能耗设计的数据中心还可以节约其他成本,例如与电源和冷却系统相关的投资成本和运营成本,同时还可节约空间。
现有数据中心的电力消耗可以通过各种低成本方法加以降低,但主要还是通过迁移到更节能的计算平台这一手段。对于新的数据中心,在 IT 架构和 NCPI 架构方面还可有其他选择,从而获得更大的节约效果。
电能消耗通常平均分布在 IT 负载和 NCPI 设备上。任何降低用电量的方法如果要具有合理性,都必须将 IT/NCPI 设计作为一个系统加以综合考虑,这样才能获得最大的益处。
有些设备提供商提供完整的标准化数据中心设计,这些数据中心为提高效率进行了专门的设计,而希望降低现有数据中心的能耗的用户还可以使用能源效率审计服务。
事实表明,与数据中心的传统设计方法相比,成本节约机会非常巨大,而实现这些节约所需要的投资却很少,在某些情况下甚至无需投资。
关于作者:
Neil Rasmussen 是 American Power Conversion 的创始人和首席技术执行官。在 APC,Neil 领导着研发预算额居全球第一的研发团队,从事关键网络的电源、冷却和机架基础设施的研究,主要的产品研发中心分布在马萨诸塞州、密苏里州、罗得岛州、丹麦、中国台湾和爱尔兰。Neil 现在领导着 APC 的模块化可扩充数据中心基础设施解决方案研究工作,并且是 APC 的 InfraStruXure 系统的主设计师。
Neil 于 1981 年创建 APC,之前他在麻省理工学院获得电子工程学士和硕士学位,其学位论文是有关 Tokamak Fusion 核反应堆的 200 兆瓦电源的分析。1979 年至 1981 年,他在麻省理工学院林肯实验室工作,从事飞轮储能系统和太阳能电力系统的研究。 |
|