随着数据中心规模和复杂程度的不断增长,高效的热管理已成为关键问题。云计算、人工智能和大数据分析推动的计算能力需求不断增长,产生大量热量,对设备寿命、运营效率和能耗构成挑战。
数据中心热管理的主要问题之一是热密度的不断上升。随着高性能计算(HPC)和服务器密集型应用的兴起,传统的空气冷却系统往往无法有效散热。空气冷却系统难以应对极高的热负荷,这可能导致热点、性能下降和硬件损坏。液体冷却或直接芯片冷却和浸没式冷却是有效的新型替代技术。更高的导热系数和有效散热能力是高密度服务器机架的主要优势。液体冷却与先进热交换器的结合也提升了整体散热性能。
由于热源广泛,因此水冷、冷却板等存在局限性,普遍考虑通过HVAC系统*实现冷却效果。
此时最重要的是冷气体在发热发生点处能够顺畅地供应,需要对此进行仿真分析的验证。
*HVAC是供暖(Heating)、通风(Ventilation)与空气调节(Air Conditioning)的英文缩写,中文全称为"供暖、通风、空调",属于建筑环境控制领域的核心技术体系。该技术以传热学、流体力学和工程热力学为理论基础,通过温度调节、湿度控制、空气净化及循环系统,实现建筑物或交通工具内部环境的舒适性与能源效率优化。作为跨领域应用技术,HVAC系统广泛应用于建筑设计与工程、制造业及汽车工业领域,各国均设有专业协会(如中国建筑学会暖通空调分会)推动技术发展。
尽管有多种散热设计方法,但除特殊情况(如珀耳帖效应(Peltier effect))外,大多数散热系统都是基于液体或气体等流体的冷却方式设计的。通常,固体部件产生热量,然后通过流体散发到外部,以冷却。这在日常生活中很容易理解,例如在炎热的天气中进入水,或通过风扇或空调降低体温。
但是,根据冷却流体的类型,分析方法有很大差异。液体的热传导率高于气体,因此冷却性能好,但密度约为1000 kg/m³,因此受重力的影响很大。这导致垂直流动集中,因此需要采用管道形式的管道设计,以有效冷却热量集中的局部区域。这可能成为设计的限制因素,因为这会导致结构限制和空间限制。因此,液体冷却通常仅限于高温部件或精密设备。
另一方面,气体密度低,受周围流动的影响大于受重力的影响。由于这种特性,可以不受空间限制地设计流动路径,并通过冷却风扇或HVAC系统将流动引导和供应到所需位置。气体可以采用多种设计例如集中向特定区域提供冷却流动,或在广阔的空间内均匀地提供,在通用性方面非常有利。出于这些原因,空气冷却方式是最常用的散热设计方式之一。
研究案例表明,气体传热中影响冷却性能的主要因素是流动速度,而不是空间大小。换句话说,为了获得更高的冷却效果,提高气体速度是有效的策略。根据这些特点,气体流动通常分为自然对流和强制对流,在实践中使用动力源的强制对流方式被广泛应用。自然对流是由于温度差引起的密度变化而引起的流动,而强制对流是通过风扇或鼓风机等设备以恒定的流动速度和方向供给气体,从而确保更积极的冷却性能。
气体流速主要由动力源的性能决定,但提高冷却效率的更根本的方法是气体如何有效地到达热源。无论您以多高的速率供应气体,如果流体无法到达热源,那么热传递将无法达到预期。因此,分析工程师的立场是,除了提高流速之外,对流道设计和分布均匀性等进行研究是必要的。通过改善流道来确保气体顺利到达发热源是确保制冷效率的关键策略之一。
检查冷循环封闭式HVAC系统内部流道时,确认在接入楼层位置没有产生均匀的气流和逆流,确认在下部有部分再循环区域,确认在上部有服务器机架的流道
在确认冷气道封闭式HVAC系统温度时,中下部可通过均匀的气流确认冷却效果是否平稳,右侧最后一台服务器机架位置可以看到相对过热的温度分布
HVAC系统内部流道审查
服务器机架温度分布
检查热循环封闭式HVAC系统内部流道时,确认在接入地板位置没有均匀的气流和逆流,确认在下部有部分再循环区域,确认在上部有服务器机架的流道 热循环式密封型HVAC系统温度确认时,中下部通过均匀的气流确认冷却效果是否平稳,左侧最后一台服务器机架位置确认相对过热的温度分布
与冷循环密封型相比,确认最大温度低约6度,并且在相同性能下被证明是高效的方案。