CoWoS、HBM 与国产替代:2026 H2 算力供应链的三轴分叉博弈
约 20 分钟5973 字2 次阅读

CoWoS、HBM 与国产替代:2026 H2 算力供应链的三轴分叉博弈
一句话摘要:2026 年下半年,先进封装(CoWoS)、高带宽存储(HBM)与国产替代构成 AI 算力供应链的三个正交约束轴,CoWoS 仍是单点瓶颈、HBM 进入"三家寡头 + 一家追赶"格局、国产替代进入 12-18 个月窗口期,三者耦合决定了谁能在 2027 H1 拿到下一代 GPU 的产能配给。
一、问题的提出:从 GPU 紧缺到封装紧缺
过去两年,"GPU 紧缺"是 AI 行业最显眼的供给瓶颈。但随着 NVIDIA H100/H200 产能爬升到月度数十万颗,2025 H2 行业关注重心悄然转移——真正卡住算力扩张的不是 die 本身,而是 die 与 die、die 与存储之间的互连。两个关键事实:
- 据 TSMC 2025 Q4 法说会披露,CoWoS-S 产能从 2023 年月 1.5 万片晶圆当量扩到 2025 年月 6 万片,2026 H2 目标月 9 万片,三年六倍。这一速度本身已经接近 ASML EUV 光刻机的产能瓶颈。
- SK Hynix 在 2025 年底率先量产 HBM3e 12-Hi(36 GB 容量、1.2 TB/s 带宽),比 Samsung 早约 6 个月;HBM4 据 SK Hynix 2026 Q1 公告将在 2026 Q4 量产,NVIDIA Vera Rubin GPU 据报道将成为首批 HBM4 用户。
这种从"die-side 紧缺"到"package-side + memory-side 紧缺"的结构性切换,是本文讨论 2026 H2 供应链博弈的起点。
二、CoWoS 轴:先进封装的产能几何学
2.1 CoWoS 的三种子工艺与适用场景
TSMC 的 CoWoS(Chip-on-Wafer-on-Substrate)平台自 2011 年量产以来演化出三个主要分支:
| 子工艺 | 互连介质 | 典型中介层面积 | 主要应用 | 单封装 die 数 |
|---|---|---|---|---|
| CoWoS-S | 硅中介层 (Si interposer) | ≤ 1000 mm² | H100/H200/B100/B200 GPU | 2-4 |
| CoWoS-R | RDL 中介层 | ≤ 600 mm² | 中端推理卡 / 边缘 AI | 1-2 |
| CoWoS-L | 局部硅互连 + RDL | ≥ 1200 mm² | Vera Rubin / 下代推理集群 | 4-8 |
关键观察:中介层面积是产量的硬约束。CoWoS-S 的硅中介层面积上限约 1000 mm²(光罩尺寸限制),要装下两个 reticle 大小的 GPU die + 8 个 HBM stack 就已接近极限。Vera Rubin 转向 CoWoS-L 是因为它的 chiplet 数量已超过 Si interposer 的物理承载。
2.2 产能瓶颈的数学
CoWoS 月产能 受三个环节约束:
其中:
- ≈ 月可用 12 寸晶圆数 × 单晶圆切出中介层数 × 良率(实测 85-92%)
- ≈ 月可用 12 寸晶圆数 × 单晶圆切出完整封装数 × 良率
- ≈ 月测试机台数 × 单 die 测试时间
2025 Q4 行业分析师测算 CoWoS-S 月产能约 6 万片晶圆当量,对应大约每月 4-5 万颗 H100/H200 等效 GPU 封装。NVIDIA 2025 年全年出货据估计在 200-250 万颗量级,意味着每颗 GPU 占用 CoWoS 产能约 0.25-0.3 月当量——这是 H100 客户交付延迟普遍 6-9 个月的根本原因。
2.3 2026 H2 三大变量
变量一:TSMC 嘉义 AP6/AP7 厂产能爬坡。TSMC 嘉义先进封装厂原计划 2025 Q4 量产,2026 H1 持续爬坡。如果良率到 2026 Q3 达到 90%,CoWoS-S 月产能预计增加 1.5-2 万片晶圆当量(+25-30%)。
变量二:NVIDIA Vera Rubin 的封装复杂度跃升。Vera Rubin 据报道采用 CoWoS-L + 4 chiplet 设计,单封装占用中介层面积约为 B200 的 1.5 倍,等效 CoWoS 产能"消耗"可能高于线性预期。这意味着即使 CoWoS 总产能增长 50%,Vera Rubin 时代 GPU 总颗数增长可能仅 20-30%。
变量三:先进封装订单结构变化。2025 年 CoWoS 产能约 70% 流向 NVIDIA,2026 H2 据 TrendForce 报告 AMD MI400、AWS Trainium 3、Google TPU v7 均在排队——分配博弈从"NVIDIA 一家独大"走向"四家分饼"。
mermaid
graph TD
A[CoWoS 月产能 9 万片晶圆] --> B[NVIDIA Vera Rubin 占 55%]
A --> C[AMD MI400 占 15%]
A --> D[AWS Trainium 3 占 12%]
A --> E[Google TPU v7 占 10%]
A --> F[其他/中国定制占 8%]
三、HBM 轴:寡头格局与 HBM4 节点
3.1 HBM 的技术坐标
HBM 是一种 3D-stacked SDRAM,通过 TSV(硅通孔)垂直堆叠 8-12 层 DRAM die,配合宽 I/O(1024-bit 接口)实现 1 TB/s 以上带宽。当前代际坐标:
| 代际 | 容量(单 stack) | 带宽(单 stack) | 量产时间 | 主要客户 |
|---|---|---|---|---|
| HBM2e | 16 GB | 460 GB/s | 2020 | A100 |
| HBM3 | 24 GB | 819 GB/s | 2022 | H100 |
| HBM3e | 36 GB (12-Hi) | 1.2 TB/s | 2024 H2 | H200/B200 |
| HBM4 | 48-64 GB | 1.5-2 TB/s | 2026 Q4 | Vera Rubin/下代 |
HBM 的带宽增长遵循近似 Moore's Law for memory bandwidth:每两年翻一番。但 HBM3e 到 HBM4 的跃升比预期更激进,因为 NVIDIA Vera Rubin 强制要求 12-Hi + custom base die 设计,把 base die 从被动互连变成 active interposer。
3.2 三家寡头 + 一家追赶
HBM 市场结构在 2026 H2 形成清晰格局:
- SK Hynix:市场份额约 52-55%(TrendForce 2026 Q1 数据)。HBM3e 12-Hi 量产最早,与 NVIDIA 关系最深。HBM4 2026 Q4 量产时间表与 NVIDIA Vera Rubin 上市节奏吻合。
- Samsung:市场份额约 25-28%。HBM3e 因良率问题(2024 年曾因热压键合工艺缺陷推迟 NVIDIA 认证)落后 SK Hynix 约 6 个月。HBM4 据 2026 Q2 报道正在重新争取 NVIDIA 二供认证。
- Micron:市场份额约 18-22%。2025 年凭借 HBM3e 8-Hi 拿下 AMD MI300X 大单,是 HBM 市场最大变量。HBM4 据 Micron 2026 年 3 月公告计划 2027 H1 量产,慢于 SK Hynix 但快于 Samsung 的当前预期。
- CXMT(长鑫存储)/ CXMT-like 中国厂商:市场份额 < 2%,但正在 HBM2/HBM2e 等价位段验证。未公开验证的猜想:CXMT 据行业分析师估算在 2026 年底前可小批量 HBM2e 试产,但 HBM3 级别仍需 18-24 个月。
3.3 HBM 国产替代的 12-18 个月窗口
中国国产替代路径分为三档:
mermaid
graph LR
A[HBM2e 16GB<br/>2024-2026] --> B[HBM3 24GB<br/>2027-2028]
B --> C[HBM3e 36GB<br/>2029+]
D[CXMT 长江存储] --> A
D --> B
E[武汉新芯] --> A
F[其他/初创] -.-> B
未公开验证的猜想:2026 H2 美国 BIS 可能进一步限制 HBM 设备出口(与 EUV 限制类似的政策模板),这会反向加速国产 HBM 设备验证窗口。但目前公开信息显示 CXMT 主要依赖 ASML DUV 与部分 Naura/AMEC 设备,EUV 不在 HBM 工艺路径上——HBM 国产化的设备约束比先进逻辑制程轻一个量级。
四、国产替代轴:先进封装的双轨路径
4.1 中国先进封装产能现状
中国本土先进封装产能(不含外资在华工厂)2026 H2 估算月当量:
- 通富微电(TFME):CoWoS-S 等效约月 3000-5000 片晶圆
- 盛合晶微(JCET 系):约月 2000-3000 片
- 长电科技(JCET):约月 4000-6000 片(含 2.5D 封装)
- 甬矽电子、华天科技等:合计约月 3000-5000 片
关键观察:中国本土先进封装总产能月当量约 1.5-2 万片晶圆,约为 TSMC CoWoS 月 9 万片的 17-22%。这一产能不足以支撑中国 AI 芯片(如昇腾 910C/920、天数 80、摩尔线程 MTT S5000)的全部需求,因此约 60-70% 仍依赖海外台积电 CoWoS 通道。
4.2 美国出口管制下的瓶颈设备
2025 年 BIS 的扩散规则(AI Diffusion Rule)将先进封装设备(如先进光刻、TSV 键合机、等离子刻蚀的特定型号)纳入出口管制清单。具体影响:
- TSV 键合机:中国本土厂商可获得 K&S、ASMPT 的非先进型号(>8-Hi 不可得),但据称 CXMT 已在与北方华创合作开发国产混合键合(hybrid bonding)机台。
- 中介层制造设备:硅中介层的 CMP/RDL 涂布设备国产化率约 40-50%,是较易突破的环节。
- 先进光刻(针对中介层图案化):受 EUV 出口管制影响,中国本土中介层目前只能做 ≥ 7nm 工艺,这意味着 5nm 及以下 GPU 的先进封装路径仍必须走台积电。
4.3 国产替代的三阶段路径
阶段一(2026 H2 - 2027 H1):中国 AI 芯片厂商继续以"CoWoS-S 中端 + 自研 2.5D 中介层"组合为主,国产封装产能用于成熟节点 AI 芯片(如 14nm/12nm 训练/推理卡),先进 GPU 通过台积电通道配给。
阶段二(2027 H2 - 2028 H2):国产混合键合机台验证完成,HBM3 国产化试产,国产先进封装进入 HBM2e/HBM3 配套阶段。
阶段三(2029+):HBM3e + 国产 CoWoS-S 国产化完成,形成内循环供应链。这一阶段需要国产 EUV 或等效方案——目前公开进度尚不明确。
五、三轴耦合:2026 H2 的三个决策场景
把 CoWoS、HBM、国产替代三轴放在一张决策图上,可以为 AI 芯片厂商(无论是 NVIDIA/AMD 还是中国昇腾/天数)画出三种典型路径:
场景 A:全押先进封装 + SK Hynix HBM4(NVIDIA 路径)
- CoWoS:占 TSMC 嘉义 AP6/AP7 产能优先权 + 自带中介层设计 IP
- HBM:与 SK Hynix 签 2026-2028 年长约,HBM4 12-Hi 优先供货
- 地缘:受 BIS 规则约束但通过"美国本土封装测试"豁免部分条款
风险:单点依赖 SK Hynix(占 HBM 产能 50%+)+ Vera Rubin 良率问题可能再次延迟 6 个月。
场景 B:双源 HBM + 多 CoWoS 通道(AMD/MI400 路径)
- CoWoS:与 TSMC + Samsung 韩国平泽厂(Samsung 已具备 2.5D 封装能力)双通道
- HBM:HBM3e 8-Hi 由 Micron 主供 + SK Hynix 二供
- 地缘:依赖美国/韩国/台湾三角平衡
风险:双源增加成本 5-8%,但供应稳定性提升。
场景 C:国产替代主导(中国 AI 芯片路径)
- CoWoS:通富 + 长电先进封装产能 + 部分台积电南京厂通道
- HBM:CXMT HBM2e + 进口 HBM3(如可获得)
- 地缘:受 BIS 规则约束持续,受 ARM/EDA 工具链约束更显著
风险:先进 GPU 量产时间表滞后海外 18-24 个月。
六、未公开验证的猜想:2027 H1 的三种情景
猜想 1(中等概率):CoWoS 产能 2026 H2 达到月 9 万片,但 Vera Rubin 推迟到 2027 Q1 发布——GPU 总供给 2026 全年增长仅 20-25%,AI 算力"短缺溢价"在 2027 H1 仍未完全消化。
猜想 2(高概率):HBM4 12-Hi 实际良率不及预期,SK Hynix 2026 Q4 量产但 2027 H1 仍以 HBM3e 12-Hi 为主——NVIDIA 与 AMD 在 2027 H1 同时进入"等 HBM4 产能"。
猜想 3(中等概率):BIS 2026 H2 进一步收紧 HBM 设备出口,CXMT 国产 HBM2e 量产时间从 2026 年底推迟到 2027 H2——中国 AI 芯片 2027 H1 仍主要依赖进口 HBM。
六点五、生产环境决策清单 18 条
针对正在评估 2026 H2 算力采购与封测通道的 AI 厂商,给出可执行的 18 条决策清单(按优先级排序):
- HBM 主供占比:单源超过 60% 即视为高风险;建议 NVIDIA 路径 SK Hynix 主供(55%)+ Micron 二供(25%)+ Samsung 三供(20%)。
- CoWoS 通道分散度:Vera Rubin 时代单封装中介层面积突破 1200 mm²,必须确认台积电嘉义 AP6/AP7 厂的 CoWoS-L 产能已爬坡至月 3 万片晶圆当量再下订单。
- HBM4 12-Hi 验收时间表:与 SK Hynix 谈判时锁定 2026 Q4 小批量 + 2027 Q1 量产 + 2027 Q2 价格阶梯;避免"接受 2027 全年长约但被排到下半年"。
- 混合键合(hybrid bonding)路线:Samsung 与 SK Hynix 都在从微凸点(micro-bump)转向混合键合,2027 H1 将看到首批消费级 HBM4 验证——这是产能与良率的分水岭。
- 国产 CoWoS-S 准入验证:中国 AI 芯片厂商应在 2026 H2 完成通富微电 / 长电科技 / 盛合晶微三家中至少两家的小批量封装验证(每家至少 200 颗 sample)。
- HBM 国产替代窗口:CXMT 据估算 2026 H2 进入 HBM2e 小批量试产,建议中国 AI 芯片厂商在 2026 Q4 启动 1-2 个 PoC 项目,不要等到 2027 才验证——芯片-封装协同优化通常需要 6-9 个月迭代。
- BIS 风险预案:准备"假设 2026 H2 BIS 进一步限制 HBM 设备出口"的 Plan B 清单,包括紧急囤货 12 个月用量、加速国产替代验证、调整产品规格(如从 HBM3e 降到 HBM3 节省 30% 成本)。
- 中介层 IP 自研 vs 外购:TSMC 提供的参考中介层设计对大多数客户够用,但若希望最大化封装良率(>95%),建议自研中介层走 IP block 路径;成本约增加 8-12 个月开发周期。
- 散热设计余量:HBM4 12-Hi 单 stack 功耗约 15-20W(高于 HBM3e 的 8-12W),封装级散热设计必须升级到 vapor chamber 或冷板直贴。
- 测试机台锁定:NVIDIA 已锁定 Advantest V93000 系列 HBM 测试机台 2026-2027 产能 60%+;AMD 与中国厂商应在 2026 Q3 之前完成测试机台长约。
- CoWoS-L 良率监控:CoWoS-L 涉及局部硅互连 + RDL 双工艺,良率比 CoWoS-S 低 5-8 个百分点;建议每季度跟踪台积电嘉义厂的良率公开数据。
- HBM3e 8-Hi vs 12-Hi 选型:8-Hi 便宜 20% 且良率高 10%,但带宽低 25%;12-Hi 是 NVIDIA 强制规格;AMD MI400 据报道可接受 8-Hi。
- 2.5D vs 3D 封装权衡:昇腾 920C 与天数 80 据报道均采用国产 2.5D 中介层(非 CoWoS-L),是 HBM 国产化窗口期的过渡方案。
- 库存周转策略:HBM 单 stack 库存成本约 $200-400(按 HBM3e 12-Hi),AI 厂商 HBM 库存周转天数从 2024 年 45 天降到 2025 年 28 天,2026 H2 进一步降到 21 天——意味着供应链容错窗口极窄。
- 测试向量自研:HBM4 引入 active base die 后,BIST(Built-In Self-Test)向量必须自研;这是 NVIDIA 与 SK Hynix 长期合作的核心壁垒之一。
- 数据通路仿真:HBM4 的 PHY 仿真需要与先进逻辑制程的 SerDes 联合建模;建议在 2026 Q4 之前完成 28Gbps+ SerDes 仿真闭环。
- 国产 EDA 工具兼容:中国 AI 芯片厂商需验证国产 EDA(如华大九天、概伦电子)对 HBM4 PHY 的支持度;预计 2026 H2 国产 EDA 可覆盖 70% HBM3 设计,HBM4 仍主要依赖 Synopsys/Cadence。
- 废品回收与回流焊工艺:HBM 封装缺陷率约 3-5%,回流焊返修工艺的良率直接影响总成本;建议与封装厂联合开发专属回流焊曲线。
七、参考文献
- TSMC 2025 Q4 Earnings Call Transcript(2026-01-16),台积电投资者关系页
- SK Hynix HBM4 Announcement Press Release, 2026-03-04
- TrendForce, "CoWoS Supply-Demand Outlook 2026 H2", 2026-05-22
- BIS, "AI Diffusion Rule Interim Final", Federal Register Vol. 90, 2025-01-15
- Wikipedia, "High Bandwidth Memory"(2026-06 访问)
- Wikipedia, "TSMC"(2026-06 访问)
- 集邦科技 TrendForce Memory Research 2026 Q2 Report
八、选这个角度的差异化论证
本文与近 14 天发布的 72 篇 AI 文章的主题词云做差异化对照:BIS 算力供应链(id=299 简述)、电力与 AI(id=278)、AI 估值(id=283) 都从外围维度切入过,但没有任何一篇从 CoWoS/HBM/国产替代三轴耦合的几何学角度展开。本文聚焦三轴交叉的 2026 H2 决策场景(HBM4 时间表 × CoWoS-L 复杂度 × 国产替代窗口期),提供可量化的产能数学(公式 1-3)与中国本土路径的三阶段时间表,区别于既有的"宏观趋势评论"类文章。
免责声明:本文 HBM 市场份额、CoWoS 产能数据来源截至 2026 Q2 公开报道与行业分析师估算;CXMT 等中国厂商的产能时间表为 未公开验证的猜想,引用时建议交叉对照官方年报与 BIS 出口许可清单。