欢迎访问广州俱进电子有限公司网站

全国销售电话:18011866680

异构集成封装的热管理影响-广州俱进电子有限公司

随着半导体行业达到较低的工艺节点,硅设计人员很难让摩尔定律产生前几代取得的成果。在单片系统芯片 (SoC) 设计中增加管芯尺寸在经济上不再可行。将单片 SoC 分解为专用芯片(称为小芯片)在成本、良率和性能方面具有显着优势。小芯片为制造商提供了优势,即能够仅缩小特定组件的工艺节点,同时将其他组件保持在更经济的尺寸。此外,一些与功率相关的因素也发挥了作用。异构集成提供了一条替代路径来与摩尔定律保持同步,而不是依赖于传统的节点缩小技术。与传统的单体结构相比,热管理,因为它们增加了功率密度、物理尺寸和几何形状。

异构集成允许将不同流程节点和功能的组件封装到单个模块中。有多种方法,包括但不限于多芯片模块 (MCM)、系统级封装 ( SiP )、2.5D 硅通孔 ( TSV ) 硅中介层和高密度扇出 ( HDFO))。其中一些技术已经存在了很长一段时间,但直到最近才开始流行将大型单片 SoC 裸片分解成更小的子组件或小芯片,这些子组件或小芯片被封装到单个模块中。这种类型的异构封装使公司能够与摩尔定律的规模和经济保持同步。异构封装的好处很多。首先,设计人员不再受限于单节点技术。单个功能可以使用旧节点大小,而迁移到最新节点没有经济意义。其次,较小的芯片尺寸允许每个晶圆有更多的芯片,因此周边的浪费更少。良率也有所提高,因为失败的子组件不需要拒绝整个 SoC。虽然有很多应用异构封装,这篇博文将特别关注高性能计算(HPC)。

半导体中的功耗

互补金属氧化物半导体 (CMOS) 器件以三种主要方式散热:动态功率、短路耗散和泄漏。当电容器吸收能量进行充电时,由于电路内的开关活动而发生动态功耗。从历史上看,这种方法是 CMOS 器件中功耗最高的来源,但最近在较低节点上,漏电流发挥了更重要的作用。对于 65nm 及以下的高科技节点,泄漏功率已增长到占设备总功耗的 50%。

功耗被认为是芯片设计中最大的限制因素. 尽管可以将越来越多的内核压缩到单个硅片中,但由于热限制,同时以全性能运行所有这些内核是不可行的。相反,必须限制或停用内核以减轻过热。无法使用硅的现象,通常被称为“暗硅”,由于热问题,硅区域必须停用,限制了整体设备的性能和效率,因为设备无法充分发挥其潜力。功耗不是一个正在消失的问题。随着硅中每次计算的功率效率不断提高,整体封装功率密度也在增加。增加封装功率密度需要仔细设计和材料考虑以优化热性能。

资料来源:英特尔

功率密度趋势

在超大规模数据中心和人工智能 (AI) 计算兴起之前,每个机架 3-5 kW 的功率密度被认为是常态。在这个级别,机架中的芯片可以使用风冷散热器进行冷却。风冷散热器会将空气释放到数据中心通道中,最终通过冷却器或制冷装置将热量提取出来。如今,人工智能和其他新的 HPC 应用需要更多的每个芯片的功率,有些甚至超过 500 W。在标准机架尺寸的情况下,通过移动空气冷却机架不再有效,甚至不可行。事实上,数据中心机架功率密度预计将继续上升,并有望在不久的将来达到每机架 15 至 30 kW。这种功率密度水平需要其他形式的冷却。

今天正在开发许多先进的冷却解决方案。理想的冷却解决方案可以使用现有的基础设施来实施,并且不会从根本上改变数据中心环境。热管和均热板在闭环中使用相变热传递,以实现显着高于铜或铝的有效热导率。这些技术今天已经广泛使用,但仍然面临着相同的挑战,即它们被实施到必须通过流动空气冷却的散热器中。冷却的下一个进展是液体冷却。这可以通过两种形式实现;通过使用冷板间接冷却或通过浸入直接冷却;后者是一种更具异国情调的形式。

谷歌张量处理单元 ( TPUv3) 带有液体冷板的人工智能机器学习板。
Cray 的 Shasta 直接液体冷却系统用于第一台百亿亿级超级计算机。

在浸没式冷却系统中,设备与介电冷却剂直接接触。根据冷却剂和配置,浸入式系统可以使用单相或两相液体运行。两相浸没式冷却在冷却液浴中的每个设备上都具有恒温的优势,但与单相系统相比,这些类型的系统实施起来更具挑战性。浸没式冷却需要一个截然不同的数据中心环境,因为几乎整个机架都必须密封以容纳冷却液。由于这与今天的习惯截然不同,因此需要克服重大障碍才能使浸入式冷却在经济上可行。无论如何,人们对直接和间接液体冷却仍然很感兴趣。开放计算项目 (OPC) 有两个项目专注于开发浸没和冷板冷却的标准化解决方案。当今广泛使用的主流风冷解决方案将无法支持 HPC 和 AI 的未来需求。

两相浸没冷却系统。(来源:AnandTech – 技嘉)

异质封装的热挑战

从热传导的角度来看,大多数异质封装形式之间几乎没有区别。在高功率封装中,将芯片或组件堆叠在高功率芯片上的情况并不常见,因此本次讨论将仅考虑 2.5D 或 MCM 风格的设计。几乎所有这些配置都涉及通过封装顶部的相同基本热流路径。从结开始,热量通过硅和热界面材料 (TIM) 传导,然后进入散热器,然后消散到系统冷却解决方案中。然而,用于异构集成的许多封装选项都有自己独特的工艺和物理特性,由于封装的翘曲及其对热界面材料的影响,它们会间接影响热性能。

 

散热器

对于大多数半导体封装, 散热器提供热性能以及保护硅和翘曲控制的优势。但是,在某些情况下,与散热器盖相比,直接将硅暴露于系统冷却解决方案可提供更好的热性能。当封装与电阻非常低的 TIM II(封装和系统散热器之间的热界面材料)和高性能散热器(例如直接液体冷却)连接时,盖子内的实际热量传播非常小。在这种情况下,热量主要从硅直接向上传导,因此沿着该热流路径去除散热器和 TIM I 的热阻可能是有益的。然而,裸露的硅并非没有自己的挑战,

考虑到具有高电阻 TIM II 和较低性能散热器的替代方案,例如简单的风冷铝散热器,散热器通常会提供热优势,因为热量在离开封装之前会扩散到更大的区域。系统冷却解决方案的热阻越高,封装内的热量传播越多。由于热阻是面积的函数,因此更大面积的热传递到 TIM II 和散热器会有效地“降低”它们的电阻。对于异质封装,封装的总面积通常存在高功率密度差异。因此,这对应于使用散热器的更多潜在优势。此外,整个封装的温度梯度越大,

带有集成散热器的封装

异构封装还涉及到组件的单个小芯片高度不同的挑战,这可能是由于制造可变性或仅仅是不同类型的组件(例如小芯片与高带宽内存 (HBM) 模块)。使用集成的散热器,它们可以被制造成通过不同的腔深度来补偿不同的高度。在考虑堆叠芯片的容差累积时,最关键的是在最高功率芯片上保持最小的 TIM 粘合线。因此,散热器腔在其设计中应考虑到这一点。

 

热界面材料

对于大多数高性能计算情况,超过 95% 的设备总功率通过封装顶部消散到系统级冷却解决方案中。在一个封装(不包括 3D)中,沿着这条路径的唯一组件是硅、热界面材料和铜(散热器材料),除了裸露芯片封装,它只有硅。由于硅是所需的半导体,而铜已经是最好的导热材料之一,因此在材料选择方面唯一的变量是热界面材料。尽管热界面材料的厚度至少比硅和散热器的厚度小一个数量级,但它通常会贡献超过 50% 的沿该路径的热阻。

TIM I 的选择对于大功率封装至关重要。该材料不仅需要低热阻,还需要能够承受封装在组装过程中所经历的条件及其使用寿命。当器件在回流或操作期间加热或冷却时,由于封装内铜、硅和有机物的热膨胀系数 (CTE) 不匹配,TIM 将承受相当大的应力。在这些应力循环期间能够保持粘附和内聚力与其体热导率同样重要。获得这些特性的平衡具有挑战性,目前最常见的是仅在光谱的相反两端找到材料。凝胶和油脂型 TIM 由载有导电颗粒的聚合物基体组成,如铝或银。这些材料具有较低的弹性模量,但与金属相比,它们的导热率仍然较低。金属焊料 TIM(例如铟)以极高的模量为代价提供非常高的热导率,这对 TIM 的可加工性和可靠性提出了挑战。

异构封装为 TIM 提供了独特的环境。TIM 不仅可以连接多个组件,还可以根据封装连接多种材料类型。此外,与大型单片芯片相比,TIM 承受的应力可能不同。关于 TIM 的异构封装的一个好处是可以在不同的组件上使用不同的 TIM。例如,中央处理器 (CPU) 芯片可以具有高性能 TIM,而低功率 HBM 模块可以使用粘性 TIM 来减少封装的翘曲。 TIM 电阻是其界面处的厚度、体热导率和接触电阻的函数。从本质上讲,异质封装通常非常大,因此这相当于大的 TIM 表面积。与 TIM 的总接触表面积相比,它的厚度要小几个数量级。这意味着材料的体电导率在 TIM 的总热阻中的作用相对较小。因此,虽然先进的金属焊接 TIM 相对于聚合物基材料具有极高的热导率,但在异质封装类型的大表面积上,热效益只是增加的。此外,由于如此大的封装的翘曲,这些高模量金属 TIM 会受到很大的应力。

载有颗粒的聚合物热界面材料的详细视图。

组件和小芯片组织

热管理的第一道防线是硅本身。硅具有相对较高的导热性,在缓解热点方面表现出色。由于异构封装将功能分解为单个组件,因此失去了大片硅的散热优势。然而,这实际上有利于热性能,因为发热组件分散开来,从而减少了它们的热串扰。

热感知组件或小芯片放置为封装的热优化提供了重要机会。芯片和封装设计人员应仔细考虑组件放置的电气和热平衡,尤其是在涉及高功率时。在可能的情况下,应将高功率组件分散开,以便在整个封装区域更均匀地分配功率。然而,封装的边缘和角落在散热方面存在限制,因此高功率密度不应太靠近周边。

 

系统集成

在不限制标线尺寸的情况下,异质封装在面积方面可以包括更多的硅。因此,他们的整体体型也趋于增长。如今,超过 70 mm x 70 mm 的 MCM 封装并不少见。在与 TIM II 和散热器相关的系统级集成时,这种相对较大的封装尺寸带来了挑战。为了保持 TIM II 界面的足够热阻,需要施加压力。对于大型 MCM 的表面积,需要相当大的力来满足这一压力要求。这不仅会在封装上产生压力,还会在系统主板上产生压力。高强度可能需要额外加强主板和/或散热器安装硬件,从而推高成本。如果无法对 TIM II 施加足够的压力,该设备将遭受热性能下降的影响。这个问题展示了在大型异构封装中实施散热器的另一个好处:散热器和 TIM II 应用的可变性可以通过散热器进行补偿,以实现更一致的热性能。

 

封装级热性能增强的影响

正如前面部分所讨论的,随着系统级冷却解决方案的进步,封装对总系统热阻的贡献越来越大。有许多选择可以利用热增强封装。在最基本的层面上,封装热阻的改进会相应地降低器件的结温。半导体器件的一个普遍参考的经验法则是,结温每升高 10°C,工作寿命就会减少一半。因此,通过封装级热增强来降低结温,可以显着提高器件的理论工作寿命。

或者,热增强封装可以在更高的功率下运行,因为系统级冷却解决方案可以支持额外的热负载,同时保持相同的结温。由于结温通常会限制芯片性能,因此这是利用具有改进热阻的封装的明确选择。

增加了一些功能以增强其热性能的封装仍然会散发与原始设计相同的热量,但结点和环境之间的温差会减小。在系统层面,降低封装的热阻有很多好处。可以增加环境或冷却溶液的环境温度,而不是降低结温,同时仍保持相同的原始结温。就风冷数据中心而言,这可以节省大量成本。

俱进集团,成立于2015年,公司以线路板样板制造为入口,具备高端样板和中小批量的快速交付能力。通过pcb制板、bom表采购以及线路板贴装等全价值链服务,为客户的产品提供垂直整合的一站式解决方案。我们持续助力于中国电子科技持续创新发展,为打造一流的电子产品设计和制造外包服务提供商。追求全体员工物质与精神两方面的幸福,为人类和社会的进步与发展做出贡献。

我们提供专业的设计解决方案,涵盖pcb和pcba布局的各个方面,包括以下的板技术。 

包括: 

1.PCB设计:免费叠层设计和阻抗计算。 

2.PCB制造:PCB制板能力1-48层,盲埋孔,铜厚最高可做12盎司 

3.组件采购:BOM采购,最快3天 

4.PCB组装: 加急样品和批量贴装加工,只需1-3天

5.功能测试

6.电子组装全球物流 

7.单面、双面、多层板 

8.刚性电路、柔性电路和刚性-柔性电路。 

请发邮件给我们,您可以马上得到报价:sales@fastturnpcbs.com

电话号码:15018735409

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部