估算精确冷却系统的冷却容量需要了解 IT 设备和数据中心里其它热源的发热量。发热率的常用度量单位包括 BTU (英国热量单位) / 小时、吨 / 天和瓦特。不同度量单位的混用给用户和规则制定者造成了很多不必要的混淆。令人欣慰的是,全球范围内的标准化组织都倾向于使用统一的标准单位:瓦特 (W) 。 BTU 和吨(指冰的冷却能力)这两个古老的术语将逐渐退出历史舞台。
IT 设备通过数据线传输的能量可以忽略不计。因此,交流电源干线所消耗的能量基本上都会转换为热量。( PoE 设备与远程终端的数据传送可能会消耗多达 30% 的能量,但是本白皮书为简化问题,假设所有能量都消耗在本地设备上。)这样一来, IT 设备的 发热量 就可以简单地等同于该设备的电力 消耗量 (均以瓦特为单位)。更简单地说,系统总发热量(即冷却需求总量)即为各组件发热量的总和,包括 IT 设备和其它项目,如 UPS 、配电系统、空调设备、照明设施以及人员。不过,这些项目的发热率可以通过简单的标准化规则轻松测算出来。
UPS 和配电系统的发热量由两部分组成:固定的损耗值和与运行功率成正比的损耗值。对于不同品牌和型号的设备,它们的这两部分热量损耗是十分一致的,因此可以比较准确地估计它们的发热量。照明设施和人员所产生的热量也可以用标准值很快估算出来。需要用户指定的变量,只有少数极易获取的数值,如地板面积和电力系统的额定功率等。
虽然空调设备的风扇和压缩机会产生巨大的热量,但是这些热量都被排放到室外,不会增加数据中心内部的热负荷。然而,这些不可避免的能量损失会降低空调系统的效率,如果空调系统比较庞大,则这部分损失在计算时也应加以考虑。
可以根据数据中心中各项设备的发热量来进行详细的热量分析,不过利用简单规则而进行快速估算的结果也是在复杂分析结果的允许误差范围之内。这种快速估算法的优势还在于,不具备专业知识或未经过专业培训的任何人都可胜任这一工作。根据表 4 中的数据,可以迅速可靠地确定数据中心的总的热负荷。如果数据中心的墙壁或屋顶受到强烈的日照,或者还有其它的环境热量释放源,则应由 HVAC 咨询师来评估这些热源如何影响整个热量需求。 表 4. 数据中心散热量计算数据表
项目 IT 设备 所需数据 IT 设备总负载(所有 IT 设备电源输入功率之和) 供电系统额定功率( UPS 系统的额定功率,不包括冗余模块) 散热量计算 散热量分类汇总 等于 IT 设备总负载功率(瓦特) ___________W (0.04 x 电源系统额定值 ) + ___________W (0.06 x IT 设备总负载功率 ) (0.02 x 电源系统额定值 ) + 带电池的 UPS 配电系统 供电系统额定功率 (0.02 x IT 设备总负载功率 ) ___________W 照明设施 地板面积(单位:平方英尺或平2.0 x 地板面积(平方英尺),方米,换算为瓦特) 数据中心最大人员数,换算为瓦特 ___________W 或 21.53 x 地板面积(平方米) 100 x 最大人员数 ___________W ___________W 人员 合计 大型节点环境的制冷
随着高密度服务器 (Blade server) 技术的采用,空气分配和冷却能力方面又出现了新问题。因为高密度服务器将电源和冷却需求集中在一个 小型因数中 ,数据中心设施面临着服务器集群提出的新问题。表 5 提出了对这类环境进行制冷的五种建议方法。 表 5. 大型节点环境制冷方法
方法 分散负载 描述 设备室的供电和冷却能力达到最大设备数以下的平均值,并且通过拆分多个机柜中设备的方法来分散机柜上那些负载超过设计平均值的设备。 运用规则借用闲置冷却能力 补充制冷 设备室的供电和冷却能力达到最大设备数以下的平均值,并且运用规则使高密度机柜能够借用周围机柜的闲置冷却能力。 设备室的供电和冷却能力达到最大设备数以下的平均值,并且根据需要使用补充的冷却设备去冷却密度超过设计平均值的机柜。 特定高密度区域 设备室的供电和冷却能力达到最大设备数以下的平均值,在具有高冷却能力的房间内划出一块特殊限制区域,只把高密度机柜安放在那里。 全局制冷 设备室中的每个机柜都具有满足最大机柜密度的供电和冷却能力 。 空气分配系统配置
在设计数据中心的冷却系统时,其目标是创建一个从冷空气源头到服务器通风口之间的洁净通道。根据性能、成本和实施难度不同,有九种基本方法可以提供 IT 设备的进出空气流。而空气的供应和返回都有三种基本方法来完成 CRAC 装置和负载之间的空气输送:( 1 )洪灌方式,( 2 )局部管道方式,( 3 )全管道方式。表 6 图解了九种可能的组合方式。 APC 第 55 号白皮书,“ 关键设备的空调结构选择方案 ”描述了这九种空气配送方法及其各自的优点。 表 6. 冷却系统类型
洪灌方式回风 局部管道方式回风 全管道方式回风 一般用途: 适合解决高热机架问题: 小型局域网机房(功耗低于 40kW ): 洪灌送风 · 安装简单 · 成本低 局部管道活动地板环境 硬地板环境 · 可冷却功耗最高为 3kW 的机· 可冷却功耗最高为 8kW 的机架 · 不需要活动地板 · 可提高 CRAC 装置的效率 活动地板环境 硬地板环境 方式· 可冷却功耗最高为 3kW 的机架 架 · 不需要活动地板 · 成本低 / 安装简单 活动地板环境 硬地板环境 方式 一般用途: 送 一般用途: 适合解决高热机架问题: · 可冷却功耗最高为 3kW 的机架 · 可冷却功耗最高为 5kW 的机· 可冷却功耗最高为 8kW 的机风 架 · 高性能 / 高效率 全管式 送 · 有垂直气流的机柜 /大型机 · 有垂直气流的机柜 /大型机 · 可冷却功耗高达 15kW 的机架 风 · 适合活动地板静压室环境 · 适合活动地板静压室环境 · 需要专门安装 架 · 可改型(视厂商而定) 活动地板环境 硬地板环境 适合解决高热机架问题: 一般用途、大型机: 道方一般用途: 使用高密度服务器所致冷却问题的十种最佳解决办法
一旦冷却系统设计安装完成,为保证系统的高性能,进行后续检查工作是很重要的。更重要的是,要维护从服务器排出的热空气到 CRAC 装置的回流空气管道之间的洁净通道。很多因素都会降低现有冷却系统的运作效率和功率密度能力。表 7 列出了十种最佳解决方法,按执行方式由简到难、成本由低到高的顺序排列。
表 7. 高密度服务器部署所致冷却问题的十种最佳解决办法 方法
进行“健康检查”
描述
?? 检查总的冷却能力,确保数据中心的 IT 设备对冷却的需要没有超过总的冷却能力。
?? 检查所有风扇和报警装置是否运行正常。确保过滤器的清洁状态。 ?? 检查冷却器和 / 或外部冷凝器、泵送系统和初级冷却回路的状况。 ?? 检查数据中心通道中重要位置的温度。
?? 记录每套机架底部、中部和顶部的空气入口处的温度,并与 IT 设备生产商的推荐值进行比较。
?? 检查可能影响冷却性能的机架间隙(没装挡板的闲置机架空间、没装挡板的空刀片插槽、未封闭的电缆开口)或多余的缆线。
启动冷却系统维护制度
应该实行定期维护制度,以达到冷却设备生产商推荐的指导方针。
在机架中安装挡板,实行电缆管理制机架内未被利用的纵向空间让设备底部流出的热空气可以通过捷径回到度
空气入口处,致使设备不必要地升温。
清除地下障碍物并封闭地板间隙 地下障碍物,如网络和电缆,会阻碍空气流动并削弱对机架的冷气供应。将高密度机架分开
如果高密度机架紧密聚集在一起,则大多数冷却系统的冷却能力都不够用。
采用热通道 / 冷通道布置 如果机架空气入口都朝向一个方向,则上一排机架排出的热空气在通道中将和供应空气或室内空气相混合,然后进入到下一排机架的前面。
将 CRAC 设备与热通道对齐 当 CRAC 设备与热通道对齐时,可达到最佳冷却效率。在这种情况下,热空气可以直接流入回风管道,而很少有机会与冷空气流混合。
管理地板通风孔 机架气流和机架布局是影响冷却性能的关键因素。送风和回风通风孔的位置如果不当,会使得热通道 / 冷通道设计的种种优点丧失殆尽。
安装气流辅助装置 在有足够平均冷却能力,但却存在高密度机架造成的热点的场合,可以通过采用有风扇辅助的设备来改善机架内的气流,并可使每一机架的冷却能力提高到 3kW ~ 8kW 。
安装自给高密度设备 在功率密度接近或超过每机架 8kW 的场合,需要将冷空气直接供应到机架的每一层(而不是从顶部或底部),以便使从上到下的温度保持一致。
以上方法可以使得数据中心能够在其峰值效率运行,以保证其可以胜任对商务过程的支持,并预防未来可能发生的问题。前八种方法可帮助典型数据中心在 其原始 设计的界限内正常运行。最后两条是对如何扩充典型数据中心冷却密度设计界限的建议(无需进行较大的重新设计和建造),方法是通过安装“自给”冷
却方案,以便满足高密度服务器应用场合的需要。
数据中心的布线问题 布线拓扑结构
数据中心拥有大量的设备,网络结构复杂,所以必须要有布线拓扑结构。由于有在 1991 年首次发布的
ANSI/TIA/EIA-568 标准,网络设计师对结构化布线很熟悉。 TIA (电信行业协会)不久前又通过了一项名为 TIA-942 “数据中心的电信基础设施标准”的标准。该标准用图 1 所示的拓扑结构来描述数据中心。下面列出这种拓扑结构中用到的基本要素。 水平布线和主干布线
如图 1 所示,有两种布线类型:主干布线和水平布线。主干布线连接总配线
区( MDA )和水平布线区( HDA )——包括电信室和引入室( ER )。主干布线由主干电缆、主交叉连接、水平交叉连接、机械终端、接插线或用于主干对主干交叉连接的跳线组成。水平布线将设备连接到 MDA 或 HAD 中的连接。水平布线由水平电缆、机械终端和接插线 / 跳线组成,还可以包括一个区域插座。
ER 或 MDA 中的交叉连接
接入电缆和数据中心电缆以某种形式在交叉连接处汇合。理想状态下,它们都接入同一个实际上成为“分界线”的交叉连接 阵列 (lineup) 。将连接到所有接入提供商的这些“分界线”集中摆放,通常称为“ meet-me room ”。不过,部分接入提供商更愿意将电缆接入自己的机架。分界交叉连接通常摆放在引入室,如果数据中心没有引入室,则摆放在总配线区。 总配线区 ( MDA ) 中的主交叉连接
根据 TIA-942 标准,每个数据中心都必须有一个总配线区,总配线区应配备核心以太网交换机与路由器、可能的核心 存储区域网络 ( SAN ) 交换 设备 、 PBX 设备、网络管理设备以及接入设备。总配线区还包括主交叉连接( MC ),用于在主干布线和核心交换机与路由器之间建立连接。因为主干布线通常采用光纤,所以主交叉连接必须设计为可处理光缆、接插线和 配线架 。根据安全、外观和 电缆 管理的不同需要,交叉连接 配线架 和网络设备被安放在机柜内或机架上。 电信室、 HDA 或 MDA 中的水平交叉连接
水平交叉连接( HC )是一个大型的接插区域,水平电缆从这里被分配到各个设备。一般来说,水平交叉连接的主要任务是提供一个将水平电缆连接到接入交换机端口的装置。 TIA-942 标准还给出了一种光缆的集中布线方法的指导,在这种方法中,水平电缆被直接连接到多光纤主干电缆,而不是交换机。 区域分配区( ZDA )中的区域插座或整合点
通常,将一组水平电缆外接到公用终接点比较有利。采用新设备后,水平电缆也可以通过区域插座连接到网络上。与固定到设备机柜的设备插座相比,区域 布线 提供更大的灵活性。区域分配区用于未来使用的“ precable ”区域,或简化频繁的重配置。 区域分配区中的插座
很多数据中心的设备分配区的大部分都被服务器机柜中的服务器占据。水平电缆通常外接到机柜,连接到 配线架 上, 配线架 即被称为“插座”或“互连”,如图 1 所示。
TIA-942 标准认可图 1 中拓扑结构的某些变化形式。例如,小型企业数据中心可以将接入室、水平布线、总配线区和电信室合并为计算机室内的一个区域。另外,大型互联网数据中心可以拥有两个接入室(保持冗余度)或者兼容多种接入服务商,也可以将总配线区和 水平布线区分别划入不同的房间或笼内以增加安全度。具体的拓扑结构依数据中心规模、可扩展性、可靠性等因素而定。 电缆介质
对于现在的数据中心 LAN 和 SAN 环境, “ 交换机 到服务器 ” 连接要求布线具有高性能和灵活性,并且具有适应未来高带宽应用的剩余空间(见表 8 )。千兆位以太网连接具有广泛的支持基础:交换机端口、网卡、 超五类非屏蔽双绞线( Category 5e UTP )和六类非屏蔽双绞线( Category 6 UTP )。然而,以太网在不断地发展,许多组织都在关注万兆位以太网在支持新应用要求方面的优势。网络规划者们应该仔细考虑如何运用这些新电缆技术,以将带宽优势融入到电缆基础设施中。 表 8. 电缆介质类型