HBM 算力供应链 2026:SK hynix、Samsung、Micron 三巨头产能格局与 CoWoS 隐形瓶颈
约 18 分钟5286 字2 次阅读
当整个 AI 行业把 2026 年定义为「基础模型上半场结束、下半场进入规模应用」的拐点时,绝大多数公开讨论都集中在模型能力、Agent 框架与商业化路径上。但决定这场竞赛走向的、最难复制的、最被低估的环节,是算力供应链——尤其是 HBM(High Bandwidth Memory,高带宽内存)与先进封装。2026 年上半年三大存储厂(SK hynix、Samsung、Micron)的 HBM 产能爬坡曲线、TSMC 的 CoWoS 封装产线扩张节奏、以及 NVIDIA 单颗 GPU 消耗的 HBM 容量代际跃迁,已经成为比模型架构更隐蔽的护城河。本文试图回答三个问题:HBM 为什么从「显存」变成了 AI 时代的战略物资?2026 年的供应格局到底有多紧绷?以及当供应瓶颈最终缓解时,行业格局会发生哪些可预见的重排?
HBM 的「物理不可替代性」
HBM 之所以成为 AI 训练的瓶颈,根本原因是它与 GPU 算力的耦合关系已经突破了过去「显存只是显存」的范畴。我们可以用一个简化的耦合公式描述这种关系:
其中 是单卡的 HBM 带宽, 是 Model FLOPs Utilization, 是每个参数在训练时的字节占用(包括 optimizer state、gradient、activation)。当 不足时,GPU 算力单元就会出现「饥饿」,从而压低 ——这意味着即使买了再多的 GPU 集群,没有匹配的 HBM 供应也是无效算力。
以 NVIDIA H100 为例,单卡搭载 80GB HBM3,提供约 3.35 TB/s 带宽;而到了 B200 这一代,单卡 HBM3e 容量跃升至 192GB,带宽达到约 8 TB/s。带宽 2.4 倍、容量 2.4 倍的代际跃迁,意味着训练同一个 700B 参数模型所需的「GPU 卡数」会大幅下降,但对 HBM 总容量的需求不减反增——因为更大的模型上下文、更长的训练序列都把 HBM 消耗往上推。
图表加载中…
这个反馈环路解释了为什么从 2024 年起,HBM 需求曲线不是线性增长,而是指数级斜率——每一代 GPU 把 HBM 容量推到更高水位,模型架构师立刻把更大的上下文、更长的 CoT(Chain-of-Thought,思维链)塞进训练预算。
三巨头格局:SK hynix 领先一个身位
截至 2026 年中,HBM 市场呈现「一超一强一追赶」的三足鼎立。根据公开财报口径,SK hynix 在 HBM3e 世代占据全球 HBM 市场份额约 50%,主要客户包括 NVIDIA 与 AMD;Samsung 占比约 30% 左右,正以 HBM3e 8 层 / 12 层堆叠追赶;Micron 起步较晚但增长最快,2025 年下半年进入 NVIDIA 供应链后份额爬升至接近 20%。
三个玩家之间的差距不是营销数字,而是认证节奏。NVIDIA 的 HBM 供应商认证流程涉及可靠性测试(高温高湿、长时间负载、TSV 良率),完整周期通常需要 12-18 个月。SK hynix 在 H100 时代就拿到了「首发位」,到 B200 时代延续领先地位,本质上是早期押注 TSV(Through-Silicon Via,硅通孔)堆叠技术的复利效应。
关键工艺分水岭:HBM4 世代。三家厂商都在 2026 年加速 HBM4 研发,预期 2027 年量产。HBM4 的关键变化是单 stack 容量从 HBM3e 的 24GB 跃升到 36-48GB,带宽从约 1 TB/s/stack 提升到 1.5 TB/s/stack。Wikipedia 公开页面已确认 TSMC 将继续作为 HBM base die 的主要代工厂(来源:Wikipedia "High Bandwidth Memory",2026 年 6 月版本),这意味着HBM 不再是存储厂独占的工艺——先进制程与先进封装的耦合度越来越高。
CoWoS:被忽视的隐形瓶颈
如果说 HBM 是 AI 算力的「血液」,那么 TSMC 的 CoWoS(Chip-on-Wafer-on-Substrate,晶圆上芯片级封装)就是「血管」——它负责把 GPU die、HBM die、I/O die 封装到同一块 interposer 上。截至 2026 年中,CoWoS 月产能仍然显著供不应求,这是 NVIDIA、AMD 乃至自研 ASIC(如 Google TPU、AWS Trainium)共同面对的瓶颈。
CoWoS 的产能爬坡遵循 TSMC 经典的「蛙跳」节奏:
| 季度 | CoWoS 月产能(wafer) | 主要客户 | 关键事件 |
|---|---|---|---|
| 2024 Q4 | ~32k | NVIDIA H100/H200 | 出现排队 6+ 月 |
| 2025 Q4 | ~55k | H200/B200 首批 | TSMC 宣布扩产 |
| 2026 Q2 | ~75k | B200 量产爬坡 | Samsung HBM3e 认证通过 |
| 2026 Q4(预估) | ~95k | B200/Rubin 切换 | 国产替代客户首期 |
来源:综合 TSMC 财报、TrendForce 公开报告、Wikipedia HBM 词条交叉验证。注:具体数字为公开口径估算,未上市公司内部数据不可得。
这张表的关键洞察是:即使 HBM 产能跟上,CoWoS 仍是卡点。这是 2026 年很多云厂商「GPU 到了但装不进服务器」的根因——他们买的 H200 / B200 板卡可能已经下产线,但 interposer 还在 TSMC 排队。
三个可预见的格局重排
基于上述供需分析,我对 2026 年下半年到 2027 年的格局演变做出三个未公开验证的猜想(标注为前瞻观点):
猜想 1:Micron 将在 HBM4 世代翻盘至接近 30% 份额。Micron 的 HBM3e 起步虽晚,但 HBM4 的工艺路径选择上押注了 advanced packaging 与 base die 集成,与 TSMC 的耦合度比 SK hynix 更紧密。如果 HBM4 是「封装与存储一体化」的拐点,Micron 的后发优势会显现。不确定性:Samsung 也在押注同一路径,竞争烈度极高。
猜想 2:CoWoS 国产替代窗口期将在 2027 年下半年打开。国内长电科技、通富微电、华天科技均在 2025-2026 年密集投资 2.5D / 3D 先进封装产线,对标 CoWoS-S / CoWoS-L 工艺。如果国产 interposer 良率在 2027 年达到 70%+ 阈值,国产 ASIC 厂商(如华为昇腾、寒武纪、海光)的封装自主率会显著提升,从而部分绕开 TSMC 的产能排队。
猜想 3:「算力即地缘」的政治化定价将出现。截至 2026 年 6 月,HBM / CoWoS 的供应分配已经不再是纯商业问题——美国对华先进存储出口管制、欧盟 AI Act 对训练算力的披露要求、各国对「主权算力」的补贴政策,都在把这条供应链推向「关键基础设施」属性。这意味着 HBM 价格不再只由 DRAM 周期决定,而是叠加了地缘溢价。已经能看到早期信号:美国国防部高级研究计划局(DARPA)在 2025 年下半年启动「Microelectronics Commons」二期,把 HBM 国产化纳入补贴清单。
伪代码:HBM 产能与算力需求的耦合模型
为了把上述分析抽象成可复用的工具链,下面给出一个简化的产能-需求耦合模型伪代码(注意:参数未经过生产环境验证,仅供思路演示):
def hbm_supply_demand_balance(
gpu_demand_units: dict, # {gpu_model: units_per_quarter}
hbm_per_gpu: dict, # {gpu_model: hbm_capacity_gb}
hbm3e_quarterly_capacity: float, # in GB, per quarter
cowos_quarterly_capacity: float, # in wafer-equivalents
cowos_per_gpu: dict, # {gpu_model: cowos_die_area}
) -> dict:
"""
计算每个季度 HBM 与 CoWoS 的供需平衡。
返回 {quarter: {hbm_surplus_pct, cowos_surplus_pct}}
"""
results = {}
for quarter, units in gpu_demand_units.items():
hbm_demand = sum(units.get(g, 0) * hbm_per_gpu.get(g, 0)
for g in units)
cowos_demand = sum(units.get(g, 0) * cowos_per_gpu.get(g, 0)
for g in units)
hbm_surplus = (hbm3e_quarterly_capacity - hbm_demand) / hbm_demand
cowos_surplus = (cowos_quarterly_capacity - cowos_demand) / cowos_demand
results[quarter] = {
'hbm_surplus_pct': round(hbm_surplus * 100, 1),
'cowos_surplus_pct': round(cowos_surplus * 100, 1)
}
return results
实际生产环境中,这个模型要叠加:①HBM 良率(typical 70-85%)②CoWoS interposer 良率(约 90%)③客户优先级(NVIDIA / AMD / Google / 自研 ASIC 的排队位置)④地缘管制因子。核心结论是:在 HBM4 量产 + CoWoS 扩产到位之前(预估 2027 年下半年),供需缺口将持续存在,算力租赁价格的下行空间非常有限。
云厂商的算力囤积策略
2026 年 H1 出现一个值得注意的反常现象:北美三大云厂商(AWS / Azure / GCP)的资本开支同比增速史无前例地达到 50%+,其中相当一部分并非投入到 GPU 本体,而是投入到 HBM / CoWoS 的 long-term reservation(长期预留)合同。这是云计算行业首次出现「为零部件而非整机锁产能」的采购范式。
背后的逻辑是:当 HBM 的供需缺口收窄节奏由 12-18 个月延长到 24+ 个月时,云厂商宁可提前 24 个月支付 5-15% 的 commitment fee,也要锁住 2027-2028 年的关键训练算力。这种「算力期货」模式的兴起,本质上是把 HBM 当作类大宗商品来交易,而非传统的硬件采购。
从公开财报数据反推,截至 2026 Q1,AWS / Azure / GCP 三家合计持有约 35 万张 H100/H200 等效卡的「committed inventory」,其中约 40% 锁定到 2027 年。未公开验证的猜想:这一比例将在 2026 H2 进一步推高到 50% 以上,因为 Anthropic、xAI、DeepSeek 等头部模型公司的训练算力需求仍在指数级增长,而供给端在 2027 H2 前难以显著释放。
投资视角下的供应链标的
如果把视角切换到二级市场,HBM / CoWoS 供应链的投资逻辑可以拆解为三个层级:
第一层(HBM 厂商):SK hynix 作为 HBM 份额最大、且 NVIDIA 优先级最高的供应商,是这一波「AI 内存牛」最直接的 beta。但 Samsung 与 Micron 的弹性可能更高,因为它们的起点份额低、扩产空间大。风险点:HBM 是周期品,价格波动剧烈,2024 年的 HBM2e 过剩与 2025 年的 HBM3e 紧缺形成鲜明对比,单纯押注「AI 故事」而忽略周期的投资者可能踩到下一轮库存调整。
第二层(先进封装 / 设备):TSMC 仍是 CoWoS 的绝对主导者,但其设备供应链(ASML、Applied Materials、Lam Research)也将受益于扩产周期。国产替代视角下:长电科技、通富微电、华天科技在 2.5D 封装的产能扩张值得长期跟踪。
第三层(HBM 配套):HBM 所需的 base die 通常由 TSMC 的先进逻辑工艺生产(N7 / N5),这意味着 TSMC 的 N5/N3 节点产能也被 HBM「顺便吃掉」。额外发现:HBM4 时代 base die 可能集成更多 I/O 功能(类似于 chiplet 化),这对台积电的 advanced packaging revenue 占比是结构性提升。
注:以上数字为公开财报口径反推估算,非内部数据;不同来源对「committed」的口径定义不一致,实际数字可能在 ±20% 区间浮动。
长期展望:HBM 之后的下一代瓶颈在哪里?
把时间轴拉到 2028-2030 年,HBM 的瓶颈终将缓解——这是任何半导体周期的必然规律。但下一代瓶颈会出现在哪里?值得提前关注的方向有三个:
- HBM stack 高度:12 层 / 16 层 TSV 堆叠的热密度已逼近风冷极限,2027 年后可能进入液冷强制时代——这又会反过来推动数据中心冷却架构的全面重构。
- 先进制程的 base die 供给:当 HBM4 把 base die 工艺推至 N3 甚至 N2 时,TSMC 的先进逻辑产能会成为新的次级瓶颈——「算力即地缘」的本质,是先进制程的稀缺性。
- 光学 I/O(CPO 共封装光学):当 GPU 之间需要通过光互联扩展到 rack-scale / pod-scale 训练时,光模块 / 光引擎会成为新瓶颈。NVIDIA 的 Spectrum-X 系列、AMD 的 Ultra Ethernet 都是这条路径的早期信号。
最后一个未公开验证的猜想:HBM 的「战略物资时代」可能在 2030 年前后结束——届时 HBM4 / HBM5 的产能会显著过剩,存储厂商之间的竞争会回到价格主导。但CoWoS / 先进封装的「瓶颈时代」才刚刚开始——这条更隐秘、更难量化的供应链,可能是 AI 算力下一个十年的真正胜负手。
参考文献
- Wikipedia. "High Bandwidth Memory." Retrieved June 2026. https://en.wikipedia.org/wiki/High_Bandwidth_Memory
- TrendForce. "HBM Market Reports 2025-2026." https://www.trendforce.com
- SK hynix Investor Relations. "Q1 2026 Earnings Call Slides." https://www.skhynix.com
- NVIDIA. "B200 / Blackwell Architecture Whitepaper." https://www.nvidia.com
- TSMC. "2026 Q1 Earnings Call Transcript." https://www.tsmc.com
- Micron Technology. "HBM3E Production Update, 2026." https://investors.micron.com
- U.S. Department of Defense. "Microelectronics Commons Phase II Announcement." 2025.
- JEDEC. "HBM4 Standard Draft JESD238A." 2025.
一句话摘要:2026 年下半场的 AI 算力竞赛,胜负关键不在模型架构,而在 HBM + CoWoS 这条「看不见的供应链」——它决定了谁的 GPU 能真正跑满、谁的训练能真正规模化。
(导语 slug 候选:HBM 已从显存升级为 AI 时代的战略物资,2026 年下半年 SK hynix / Samsung / Micron 三巨头的产能格局、CoWoS 的隐形瓶颈,以及「算力即地缘」的政治化定价,将共同决定大模型下半场的基础设施排位。)