反思数据中心的设计

数据中心围绕服务器机架建造服务器机房,可以有助于减轻服务器机房冷却方面的挑战压力,并节省运营资金。

几十年来,大多数企业组织都是由外而内的逐步架构他们的数据中心:也就是说,他们往往是从数据中心的建筑设计开始着手,然后再才考虑如何定位安置和冷却该数据中心建筑物内的服务器机架的。然而,现如今,越来越多的设计历史陈旧的数据中心已然无法有效地应对当前不断稳定的爬升的功率密度和数据中心的日渐提升的操作环境温度了。

由此,当前的企业组织纷纷正在慢慢开始采用一种全新的数据中心设计方法,在这种全新的设计方法中,他们将由内而外的规划其新的设施,首先选择服务器机架及其冷却技术,然后围绕它们进行数据中心设计的结构。

在本文中,我们将与广大读者朋友们共同探讨使得当前企业数据中心的冷却比以往任何时候都更具挑战性的相关因素,并还将为大家解释为什么从服务器机架,而不是服务器机房开始着手数据中心的设计流程可以帮助企业降低能耗,增加容量,并优化数据中心占地空间的利用率。

数据中心冷却挑战

得益于当前企业组织对于各种新兴技术的广泛积极的采用,使得当前企业数据中心的操作运行始终保持在一个相对安全的工作温度范围内,而这些新兴的技术就包括:

●虚拟化技术:借助虚拟化技术的部署,一款单一的物理服务器就能支持多台虚拟机,而且每台虚拟机都有其自己的操作系统和应用程序。这反过来,可以降低企业的硬件采购和维护成本,进而使得企业组织得以能够将未充分利用的服务器整合到更少数量、功能更为强大的主机设备上。但是,实现了更为充分利用的服务器同时也将会是一台散热更多的服务器。此外,一些使用了虚拟化技术的企业组织也在同时使用管理软件,以便能够根据工作负载的均衡要求,将虚拟机动态的重新定位托管到新的主机服务器上。在这样的数据中心,相关利用率最高的设施的散热量也就最大,故而会使得数据中心的某些部分可能每天甚至每小时的都散热需求都不同。

●刀片式服务器:刀片式服务器通常与虚拟化技术结合使用,是即插即用的处理单元,具有共享的供电电源、风扇、电缆和存储。通过将大量的计算容量压缩到少量空间,刀片服务器可以有助于显著的降低数据中心的空间占地需求。但不幸的是,刀片式服务器会将每台服务器机架的功率密度提升到15 kW以上,从而显著提高数据中心的散热水平。

●多核处理器:今天的多核服务器处理器比它们的单核前代产品功能要强大得多,当然,他们对于电力的需求也远远超过了前代产品。实际上,配备了双核或四核处理器的服务器平均每台机架所消耗的功率将达到12到16 kW,从而显著提高了服务器机架的操作运行温度。

●云计算:为了降低运营开销,并提高效率,当前有越来越多的企业开始纷纷积极的采用云计算解决方案。根据全球知名的市场分析公司IDC的调研数据显示,在全球范围内,通过互联网交付提供应用程序和基础设施资源的公共云服务解决方案领域的支出已经从2010年的215亿美元跃升至2015年的729亿美元。与此同时,私有云服务基础架构也在企业数据中心迅速发挥着重要作用。对于私有云服务基础架构而言,其与公共云服务所采用的技术基本相同,仅仅只是在企业的防火墙之内使用。然而,这两种类型的云服务通常都需要使用大量的商品化服务器,进而将显著增加企业的功率和冷却散热需求。

此外,更为复杂的是,今天的数据中心设计人员还必须充分考虑到除了上述这些技术因素之外的非技术型因素,而这些非技术型因素包括:

●政府相关机构旨在降低数据中心耗电量和温室气体排放量的环境保护监管法律法规的不断出台,包括诸如英国的碳减排承诺立法,正在变得越来越普遍,推动企业数据中心必须尽可能的实现更高的能源效率。

●由于当前的数据中心业界对于诸如风能和太阳能,老化电力传输系统和公用电力服务事业放松管制计划等环境友好,但成本昂贵的电源的采用日益增多,使得能源成本不断上升,进一步促进了业界对于更高能源效率的需求。

  ●诸如美国环境保护局等监管机构以及众多的公用电力服务公司正在向数据中心企业提供节能奖励回扣,以推动实现显著的节能效果。

  ●构建和运营数据中心的高额成本代价使得当前的企业纷纷都在积极的在不影响对于其业务需求满足的前提下,寻求缩小其计算设施的物理占地空间的方法。

数据中心冷却策略的演变

在功率密度和散热需求水平不断提高的推动下,近年来,企业数据中心的冷却散热管理策略也发生了重大变化。

  1、混沌空气分配策略

  直到最近,大多数数据中心的冷却方案都依赖于所谓的“混沌”空气分配方法。在该方法中,围绕着服务器机房周边的计算机房空调(CRAC)单元提供大量的冷空气,而这些冷空气即用于冷却IT设备,同时还用于帮助将服务器所排出的热的废气推向设施的回风管道。

  然而,这种混乱的空气分布通常会导致各种显著的降低效率方面的问题,包括:

  ●再循环:热废气很可能回到服务器进气口,进而将IT设备加热到潜在的危险操作温度。

  ●空气分层:基于不同温度层中的空气质量的自然趋势可能会迫使精密冷却设备的设定点需要低于推荐值。

  ●旁路空气:冷却的供气可以在通过服务器之前加入回流气流,从而降低冷却效率。

图1:再循环是一种热废气重新进入服务器设备,而并为返回CRAC设备的现象

2、热通道/冷通道策略

为了提高冷却效率,并与数据中心操作环境温度的稳步攀升保持同步,一些企业很快转向开始采用服务器机架的热通道/冷通道分隔定位安排机架的方法,该方法将相邻既定服务器机架行的热空气排气口在热通道彼此面对面,而冷空气进气口则在冷通道彼此面对面。这种配置方法有助于产生气流的对流,进而产生连续的冷却气流。

尽管如此,虽然该方法优于混沌空气分配策略,但热通道/冷通道隔离的策略已被证明仅仅只能够为当前日益密集的数据中心提供足够的冷却能力。这主要是因为这两种方法最终都具有一大共同的致命缺陷:这两种方法都允许空气在整个数据中心操作环境空间内自由的流通。

3、密封遏制策略

上述管理策略方案的共同缺陷最终导致了密封遏制冷却策略的采用。该方案主要是被设计用于组织和控制气流,这种解决方案将服务器机架封装在密封结构中,捕获热废气,并将这些热废气排放到CRAC单元,然后将冷空气直接输送到服务器设备的进气口。最终,该方案为企业数据中心的管理带来了一系列重大的益处:

  ●提高冷却效率:通过防止供应的冷空气和返回的热气流的混合,精心设计的密封解决方案可消除再循环,空气分层和旁路气流所导致的冷却气流的浪费,从而提升冷却效率。

  ●提高可靠性:消除了再循环备用服务器免于暴露于暖空气之中的潜在危险,而暖空气可能导致热关机,进而提高了数据中心的可靠性。

  ●降低能源消耗:为了抵消再循环热废气的影响,传统的冷却方案通常将回风冷却至55华氏度/ 12.78摄氏度。但是,基于密封遏制的冷却系统完全隔离了回风,因此可以安全地输送65华氏度/ 18.34摄氏度的供气。因此,密封遏制冷却策略通常可将CRAC单元的功耗平均降低16%,进而降低能源消耗。

  ●更好的数据中心操作环境空间的布局灵活性:为了使热通道/冷通道策略产生有效的冷却气流的对流,企业数据中心必须将其服务器机架放置在对齐的,均匀排列的机架行中。但是,密封遏制策略并不依赖于气流的对流,因此该策略使得数据中心的设计人员们能够将服务器机架定位在最适合其需求的任何配置中。

图2:基于密封遏制的冷却策略通过完全隔离供气和回风气流来提高冷却效率

围绕服务器机架设计数据中心

尽管采取密封遏制的策略对数据中心的冷却带来了革命性的影响,但大多数企业组织的数据中心仍然以与以往差不多的方式继续规划其新的计算设施。首先,他们设计一座建筑,并将其中的一部分规划用于数据处理大厅或白空间。然后,他们将采用尽可能多的服务器机架填充空白区域。

但是,以传统方式设计的数据中心可能会产生各种各样的问题。例如,规格过小或过大的电力和冷却基础设施可能会引发对于运营能力的不必要额限制或增加资本支出。不方便定位的结构元件可以迫使密封遏制管道以降低其效率的方式弯曲和绕行。服务器机房的过道过窄或不够长会使服务器机架放置复杂化,并导致地面空间的浪费。

因此,越来越多的企业组织开始认识到数据中心的设计是充满了智慧的,不是先建造起了数据中心建筑大楼然后安置进入服务器机架即可,而是需要围绕着服务器机架来进行数据中心建筑大楼的设计建造。由此,他们不再是先建造其数据中心建筑,然后简单的用服务器机架填充服务器机房了,而是根据他们实际业务的需求来选择好理想的机架,并围绕这些机架来进行服务器机房的设计。他们正在为他们将要使用的精确硬件和机箱阵列安装最佳的基础设施,而不是低估或过度配置新设施的电力和冷却资源。他们不是选择当结构缺陷导致解决效率的低下问题发生时立即应对,而是选择了从开始设计之初就防止这些缺陷的发生。最终结果是不仅使得数据中心的冷却和维护成本更低,而且更可靠,更适合业务需求。

围绕数据中心服务器机架实施规划的关键步骤

从服务器机架出发,来进行数据中心的规划与传统设计方法是背道而驰的,但却能够始终如一地带来更好的结果。以下是围绕数据中心服务器机架实施规划的基本措施:

1、需求收集

围绕服务器机架设计数据中心的核心优势在于,该方案允许企业数据中心能够根据相关确切的技术和业务需求定制设施。那么,确定这些需求就应该成为数据中心规划过程首当其冲的第一步。 特别是,请务必评估您企业数据中心在以下重要领域的要求:

  功率密度:对于该需求的估算是最为重要的,因为其在设计过程的后期将会推动好几项重要决策的制定。同时还请务必注意,您数据中心的功率密度评估不仅仅应考虑近期的业务需求,还应充分考虑到未来长期的需求。

  资金预算:对新数据中心可用资金和运营资金的实际理解预算将帮助您企业适当平衡效率和成本。

  数据中心的选址:构建数据中心的地理选址也可能是关键性的设计决策影响因素。例如,除最热气候地带之外的所有企业组织都可能希望在其新的数据中心设施中安置空气侧的节能器。空气侧节能器使企业数据中心能够通过用从室外泵入的自然冷空气替换热废气的方法来减少对耗电的CRAC装置的依赖。有相关的研究表明,即使在温和或温带的气候条件下,空气侧的节能器至少也是部分季节时间段的较为实用的选择方案。

2、确定选择行级还是机架级的冷却方案

在最高级别,大多数基于密封遏制的冷却方案分为两类:行级和机架级。在行级系统中,服务器机架的整行或通道位于共享机箱内,共享机柜和CRAC单元或建筑物范围的冷却系统支持。在机架级系统中,每台单独的机架都有自己的机箱,压力通风系统和冷却设备。虽然任一选项都能够处理高功率的密度,但机架级设计往往功能更强大,成本也更高。这通常使他们成为预测极高功率密度的企业数据中心的更好选择,只要他们能够承担得起更高额的前期投资成本。

3、决定选择被动还是主动的密封遏制方案

大多数密封遏制冷却策略主要依赖于被动的排气系统,其中服务器硬件内置的排气扇完成大部分的散热工作,即将供气吸入并驱动返回空气。然而,有时候,一种称为回流或背压的现象会抑制气流,导致服务器风扇无法保持返回和供气流的正常流通。在这种情况下,必须使用配备有更强大风扇的主动排气系统。

  当考虑是否使用被动或主动的密封遏制冷却方案时,请牢记以下几点:

  ●通常,大多数基于行的冷却解决方案仅采用被动的排气设计。

  ●而机架级冷却方案中的每台机柜都很少需要主动的密封。使用机架级冷却的数据中心通常更好地将被动的密封封装作为其默认选择,然后在易于回流的特定位置选择性地安装主动的排气产品。

4、确定冷通道和热通道密封遏制之间的关系

大多数行级冷却方案都具有冷通道或热通道分离的密封设计,这两种方式均采用传统的热通道/冷通道空气分配方法。冷通道密封系统封闭了服务器机房的冷通道部分,允许热废气在其他任何地方自由流动。热通道密封系统隔离服务器机房的热通道部分,允许冷空气在其他地方自由移动。这两种方法都可以提高CRAC装置的效率和容量,或者通过在冷通道解决方案中专门在服务器设备上引导供气,或者在热通道解决方案中将废气直接引导到冷却器。

虽然企业数据中心在冷通道和热通道密封遏制方案之间进行选择时必须权衡一些问题,但考虑以下两大因素则可以帮助简化某些情况下决策的制定:

  ●由于冷通道密封允许热回风的自由流通,服务器机房的温度很快就会让数据中心的操作运营员工和访客感到不舒服。热通道密封装置使用冷空气填充服务器机房,从而改善了工作和观察条件。因此,需要安排操作运营管理人员定期出现在服务器机房中的数据中心通常更倾向于采用热通道密封系统。

  ●空气侧节约通常仅适用于利用热通道密封遏制的数据中心,使其成为那些想要 利用空气侧节能器所带来的节省的数据中心的行级密封遏制策略。

图3:如此图所示,热通道封闭系统包围热通道/冷通道数据中心的热通道部分

5、执行计算流体动力学研究

一旦企业数据中心确定了将使用哪种机架和冷却解决方案,并围绕该解决方案进行服务器机房的设计。那么,下一步就是进行计算流体动力学(CFD)分析。这些研究将会涉及到使用复杂的软件来模拟潜在数据中心操作环境空间内的热空气流和冷空气流的布局。借助CFD评估可以帮助您在构建开始之前消除数据中心设计中的缺陷和低效率,从而使的数据中心管理运营人员们可以更轻松,更经济地修复这些缺陷和低效率。

图4.:CFD研究可以帮助数据中心管理运营人员们发现和解决数据中心设计中与冷却相关的缺陷

结论

从内到外设计数据中心建筑物有悖于几个世纪的建筑智慧。但是,通过选择服务器机架作为数据中心规划流程的起点而不是终点,企业可以通过确保其电源,冷却和IT基础架构最适合其业务需求,进而提高可靠性,并节省资金。因此,每家企业都应该仔细分析他们当前和未来的业务需求,并严格评估潜在的冷却和密封遏制策略,这是他们构建新数据中心的第一步。采用这种数据中心设计方法,将使得他们得以能够提高关键任务计算设施的效率和成本效益。

资料免费送(点击链接下载)

史上最全,数据中心机房标准及规范汇总(下载)

数据中心运维管理 | 资料汇总(2017.7.2版本)

加入运维管理VIP群(点击链接查看)

《数据中心运维管理》VIP技术交流群会员招募说明

(0)

相关推荐