博客
文章系列日历
归档关于搜索

鄂ICP备19019526号

© 2026 博客

  1. 文章
  2. CoWoS、HBM 与国产替代:2026 H2 算力供应链的三轴分叉博弈

CoWoS、HBM 与国产替代:2026 H2 算力供应链的三轴分叉博弈

2026年7月2日·约 20 分钟·5973 字·2 次阅读
AI 行业趋势
CoWoS、HBM 与国产替代:2026 H2 算力供应链的三轴分叉博弈

目录

  • 一、问题的提出:从 GPU 紧缺到封装紧缺
  • 二、CoWoS 轴:先进封装的产能几何学
  • 2.1 CoWoS 的三种子工艺与适用场景
  • 2.2 产能瓶颈的数学
  • 2.3 2026 H2 三大变量
  • 三、HBM 轴:寡头格局与 HBM4 节点
  • 3.1 HBM 的技术坐标
  • 3.2 三家寡头 + 一家追赶
  • 3.3 HBM 国产替代的 12-18 个月窗口
  • 四、国产替代轴:先进封装的双轨路径
  • 4.1 中国先进封装产能现状
  • 4.2 美国出口管制下的瓶颈设备
  • 4.3 国产替代的三阶段路径
  • 五、三轴耦合:2026 H2 的三个决策场景
  • 场景 A:全押先进封装 + SK Hynix HBM4(NVIDIA 路径)
  • 场景 B:双源 HBM + 多 CoWoS 通道(AMD/MI400 路径)
  • 场景 C:国产替代主导(中国 AI 芯片路径)
  • 六、未公开验证的猜想:2027 H1 的三种情景
  • 六点五、生产环境决策清单 18 条
  • 七、参考文献
  • 八、选这个角度的差异化论证

CoWoS、HBM 与国产替代:2026 H2 算力供应链的三轴分叉博弈

一句话摘要:2026 年下半年,先进封装(CoWoS)、高带宽存储(HBM)与国产替代构成 AI 算力供应链的三个正交约束轴,CoWoS 仍是单点瓶颈、HBM 进入"三家寡头 + 一家追赶"格局、国产替代进入 12-18 个月窗口期,三者耦合决定了谁能在 2027 H1 拿到下一代 GPU 的产能配给。

一、问题的提出:从 GPU 紧缺到封装紧缺

过去两年,"GPU 紧缺"是 AI 行业最显眼的供给瓶颈。但随着 NVIDIA H100/H200 产能爬升到月度数十万颗,2025 H2 行业关注重心悄然转移——真正卡住算力扩张的不是 die 本身,而是 die 与 die、die 与存储之间的互连。两个关键事实:

  1. 据 TSMC 2025 Q4 法说会披露,CoWoS-S 产能从 2023 年月 1.5 万片晶圆当量扩到 2025 年月 6 万片,2026 H2 目标月 9 万片,三年六倍。这一速度本身已经接近 ASML EUV 光刻机的产能瓶颈。
  2. SK Hynix 在 2025 年底率先量产 HBM3e 12-Hi(36 GB 容量、1.2 TB/s 带宽),比 Samsung 早约 6 个月;HBM4 据 SK Hynix 2026 Q1 公告将在 2026 Q4 量产,NVIDIA Vera Rubin GPU 据报道将成为首批 HBM4 用户。

这种从"die-side 紧缺"到"package-side + memory-side 紧缺"的结构性切换,是本文讨论 2026 H2 供应链博弈的起点。

二、CoWoS 轴:先进封装的产能几何学

2.1 CoWoS 的三种子工艺与适用场景

TSMC 的 CoWoS(Chip-on-Wafer-on-Substrate)平台自 2011 年量产以来演化出三个主要分支:

子工艺互连介质典型中介层面积主要应用单封装 die 数
CoWoS-S硅中介层 (Si interposer)≤ 1000 mm²H100/H200/B100/B200 GPU2-4
CoWoS-RRDL 中介层≤ 600 mm²中端推理卡 / 边缘 AI1-2
CoWoS-L局部硅互连 + RDL≥ 1200 mm²Vera Rubin / 下代推理集群4-8

关键观察:中介层面积是产量的硬约束。CoWoS-S 的硅中介层面积上限约 1000 mm²(光罩尺寸限制),要装下两个 reticle 大小的 GPU die + 8 个 HBM stack 就已接近极限。Vera Rubin 转向 CoWoS-L 是因为它的 chiplet 数量已超过 Si interposer 的物理承载。

2.2 产能瓶颈的数学

CoWoS 月产能 CCC 受三个环节约束:

C=min⁡(Cinterposer,Cassembly,Ctest)C = \min\left(C_{\text{interposer}}, C_{\text{assembly}}, C_{\text{test}}\right)C=min(Cinterposer​,Cassembly​,Ctest​)

其中:

  • CinterposerC_{\text{interposer}}Cinterposer​ ≈ 月可用 12 寸晶圆数 × 单晶圆切出中介层数 × 良率(实测 85-92%)
  • CassemblyC_{\text{assembly}}Cassembly​ ≈ 月可用 12 寸晶圆数 × 单晶圆切出完整封装数 × 良率
  • CtestC_{\text{test}}Ctest​ ≈ 月测试机台数 × 单 die 测试时间

2025 Q4 行业分析师测算 CoWoS-S 月产能约 6 万片晶圆当量,对应大约每月 4-5 万颗 H100/H200 等效 GPU 封装。NVIDIA 2025 年全年出货据估计在 200-250 万颗量级,意味着每颗 GPU 占用 CoWoS 产能约 0.25-0.3 月当量——这是 H100 客户交付延迟普遍 6-9 个月的根本原因。

2.3 2026 H2 三大变量

变量一:TSMC 嘉义 AP6/AP7 厂产能爬坡。TSMC 嘉义先进封装厂原计划 2025 Q4 量产,2026 H1 持续爬坡。如果良率到 2026 Q3 达到 90%,CoWoS-S 月产能预计增加 1.5-2 万片晶圆当量(+25-30%)。

变量二:NVIDIA Vera Rubin 的封装复杂度跃升。Vera Rubin 据报道采用 CoWoS-L + 4 chiplet 设计,单封装占用中介层面积约为 B200 的 1.5 倍,等效 CoWoS 产能"消耗"可能高于线性预期。这意味着即使 CoWoS 总产能增长 50%,Vera Rubin 时代 GPU 总颗数增长可能仅 20-30%。

变量三:先进封装订单结构变化。2025 年 CoWoS 产能约 70% 流向 NVIDIA,2026 H2 据 TrendForce 报告 AMD MI400、AWS Trainium 3、Google TPU v7 均在排队——分配博弈从"NVIDIA 一家独大"走向"四家分饼"。

mermaid
graph TD
    A[CoWoS 月产能 9 万片晶圆] --> B[NVIDIA Vera Rubin 占 55%]
    A --> C[AMD MI400 占 15%]
    A --> D[AWS Trainium 3 占 12%]
    A --> E[Google TPU v7 占 10%]
    A --> F[其他/中国定制占 8%]

三、HBM 轴:寡头格局与 HBM4 节点

3.1 HBM 的技术坐标

HBM 是一种 3D-stacked SDRAM,通过 TSV(硅通孔)垂直堆叠 8-12 层 DRAM die,配合宽 I/O(1024-bit 接口)实现 1 TB/s 以上带宽。当前代际坐标:

代际容量(单 stack)带宽(单 stack)量产时间主要客户
HBM2e16 GB460 GB/s2020A100
HBM324 GB819 GB/s2022H100
HBM3e36 GB (12-Hi)1.2 TB/s2024 H2H200/B200
HBM448-64 GB1.5-2 TB/s2026 Q4Vera Rubin/下代

HBM 的带宽增长遵循近似 Moore's Law for memory bandwidth:每两年翻一番。但 HBM3e 到 HBM4 的跃升比预期更激进,因为 NVIDIA Vera Rubin 强制要求 12-Hi + custom base die 设计,把 base die 从被动互连变成 active interposer。

3.2 三家寡头 + 一家追赶

HBM 市场结构在 2026 H2 形成清晰格局:

  • SK Hynix:市场份额约 52-55%(TrendForce 2026 Q1 数据)。HBM3e 12-Hi 量产最早,与 NVIDIA 关系最深。HBM4 2026 Q4 量产时间表与 NVIDIA Vera Rubin 上市节奏吻合。
  • Samsung:市场份额约 25-28%。HBM3e 因良率问题(2024 年曾因热压键合工艺缺陷推迟 NVIDIA 认证)落后 SK Hynix 约 6 个月。HBM4 据 2026 Q2 报道正在重新争取 NVIDIA 二供认证。
  • Micron:市场份额约 18-22%。2025 年凭借 HBM3e 8-Hi 拿下 AMD MI300X 大单,是 HBM 市场最大变量。HBM4 据 Micron 2026 年 3 月公告计划 2027 H1 量产,慢于 SK Hynix 但快于 Samsung 的当前预期。
  • CXMT(长鑫存储)/ CXMT-like 中国厂商:市场份额 < 2%,但正在 HBM2/HBM2e 等价位段验证。未公开验证的猜想:CXMT 据行业分析师估算在 2026 年底前可小批量 HBM2e 试产,但 HBM3 级别仍需 18-24 个月。

3.3 HBM 国产替代的 12-18 个月窗口

中国国产替代路径分为三档:

mermaid
graph LR
    A[HBM2e 16GB<br/>2024-2026] --> B[HBM3 24GB<br/>2027-2028]
    B --> C[HBM3e 36GB<br/>2029+]
    D[CXMT 长江存储] --> A
    D --> B
    E[武汉新芯] --> A
    F[其他/初创] -.-> B

未公开验证的猜想:2026 H2 美国 BIS 可能进一步限制 HBM 设备出口(与 EUV 限制类似的政策模板),这会反向加速国产 HBM 设备验证窗口。但目前公开信息显示 CXMT 主要依赖 ASML DUV 与部分 Naura/AMEC 设备,EUV 不在 HBM 工艺路径上——HBM 国产化的设备约束比先进逻辑制程轻一个量级。

四、国产替代轴:先进封装的双轨路径

4.1 中国先进封装产能现状

中国本土先进封装产能(不含外资在华工厂)2026 H2 估算月当量:

  • 通富微电(TFME):CoWoS-S 等效约月 3000-5000 片晶圆
  • 盛合晶微(JCET 系):约月 2000-3000 片
  • 长电科技(JCET):约月 4000-6000 片(含 2.5D 封装)
  • 甬矽电子、华天科技等:合计约月 3000-5000 片

关键观察:中国本土先进封装总产能月当量约 1.5-2 万片晶圆,约为 TSMC CoWoS 月 9 万片的 17-22%。这一产能不足以支撑中国 AI 芯片(如昇腾 910C/920、天数 80、摩尔线程 MTT S5000)的全部需求,因此约 60-70% 仍依赖海外台积电 CoWoS 通道。

4.2 美国出口管制下的瓶颈设备

2025 年 BIS 的扩散规则(AI Diffusion Rule)将先进封装设备(如先进光刻、TSV 键合机、等离子刻蚀的特定型号)纳入出口管制清单。具体影响:

  • TSV 键合机:中国本土厂商可获得 K&S、ASMPT 的非先进型号(>8-Hi 不可得),但据称 CXMT 已在与北方华创合作开发国产混合键合(hybrid bonding)机台。
  • 中介层制造设备:硅中介层的 CMP/RDL 涂布设备国产化率约 40-50%,是较易突破的环节。
  • 先进光刻(针对中介层图案化):受 EUV 出口管制影响,中国本土中介层目前只能做 ≥ 7nm 工艺,这意味着 5nm 及以下 GPU 的先进封装路径仍必须走台积电。

4.3 国产替代的三阶段路径

阶段一(2026 H2 - 2027 H1):中国 AI 芯片厂商继续以"CoWoS-S 中端 + 自研 2.5D 中介层"组合为主,国产封装产能用于成熟节点 AI 芯片(如 14nm/12nm 训练/推理卡),先进 GPU 通过台积电通道配给。

阶段二(2027 H2 - 2028 H2):国产混合键合机台验证完成,HBM3 国产化试产,国产先进封装进入 HBM2e/HBM3 配套阶段。

阶段三(2029+):HBM3e + 国产 CoWoS-S 国产化完成,形成内循环供应链。这一阶段需要国产 EUV 或等效方案——目前公开进度尚不明确。

五、三轴耦合:2026 H2 的三个决策场景

把 CoWoS、HBM、国产替代三轴放在一张决策图上,可以为 AI 芯片厂商(无论是 NVIDIA/AMD 还是中国昇腾/天数)画出三种典型路径:

场景 A:全押先进封装 + SK Hynix HBM4(NVIDIA 路径)

  • CoWoS:占 TSMC 嘉义 AP6/AP7 产能优先权 + 自带中介层设计 IP
  • HBM:与 SK Hynix 签 2026-2028 年长约,HBM4 12-Hi 优先供货
  • 地缘:受 BIS 规则约束但通过"美国本土封装测试"豁免部分条款

风险:单点依赖 SK Hynix(占 HBM 产能 50%+)+ Vera Rubin 良率问题可能再次延迟 6 个月。

场景 B:双源 HBM + 多 CoWoS 通道(AMD/MI400 路径)

  • CoWoS:与 TSMC + Samsung 韩国平泽厂(Samsung 已具备 2.5D 封装能力)双通道
  • HBM:HBM3e 8-Hi 由 Micron 主供 + SK Hynix 二供
  • 地缘:依赖美国/韩国/台湾三角平衡

风险:双源增加成本 5-8%,但供应稳定性提升。

场景 C:国产替代主导(中国 AI 芯片路径)

  • CoWoS:通富 + 长电先进封装产能 + 部分台积电南京厂通道
  • HBM:CXMT HBM2e + 进口 HBM3(如可获得)
  • 地缘:受 BIS 规则约束持续,受 ARM/EDA 工具链约束更显著

风险:先进 GPU 量产时间表滞后海外 18-24 个月。

六、未公开验证的猜想:2027 H1 的三种情景

猜想 1(中等概率):CoWoS 产能 2026 H2 达到月 9 万片,但 Vera Rubin 推迟到 2027 Q1 发布——GPU 总供给 2026 全年增长仅 20-25%,AI 算力"短缺溢价"在 2027 H1 仍未完全消化。

猜想 2(高概率):HBM4 12-Hi 实际良率不及预期,SK Hynix 2026 Q4 量产但 2027 H1 仍以 HBM3e 12-Hi 为主——NVIDIA 与 AMD 在 2027 H1 同时进入"等 HBM4 产能"。

猜想 3(中等概率):BIS 2026 H2 进一步收紧 HBM 设备出口,CXMT 国产 HBM2e 量产时间从 2026 年底推迟到 2027 H2——中国 AI 芯片 2027 H1 仍主要依赖进口 HBM。

六点五、生产环境决策清单 18 条

针对正在评估 2026 H2 算力采购与封测通道的 AI 厂商,给出可执行的 18 条决策清单(按优先级排序):

  1. HBM 主供占比:单源超过 60% 即视为高风险;建议 NVIDIA 路径 SK Hynix 主供(55%)+ Micron 二供(25%)+ Samsung 三供(20%)。
  2. CoWoS 通道分散度:Vera Rubin 时代单封装中介层面积突破 1200 mm²,必须确认台积电嘉义 AP6/AP7 厂的 CoWoS-L 产能已爬坡至月 3 万片晶圆当量再下订单。
  3. HBM4 12-Hi 验收时间表:与 SK Hynix 谈判时锁定 2026 Q4 小批量 + 2027 Q1 量产 + 2027 Q2 价格阶梯;避免"接受 2027 全年长约但被排到下半年"。
  4. 混合键合(hybrid bonding)路线:Samsung 与 SK Hynix 都在从微凸点(micro-bump)转向混合键合,2027 H1 将看到首批消费级 HBM4 验证——这是产能与良率的分水岭。
  5. 国产 CoWoS-S 准入验证:中国 AI 芯片厂商应在 2026 H2 完成通富微电 / 长电科技 / 盛合晶微三家中至少两家的小批量封装验证(每家至少 200 颗 sample)。
  6. HBM 国产替代窗口:CXMT 据估算 2026 H2 进入 HBM2e 小批量试产,建议中国 AI 芯片厂商在 2026 Q4 启动 1-2 个 PoC 项目,不要等到 2027 才验证——芯片-封装协同优化通常需要 6-9 个月迭代。
  7. BIS 风险预案:准备"假设 2026 H2 BIS 进一步限制 HBM 设备出口"的 Plan B 清单,包括紧急囤货 12 个月用量、加速国产替代验证、调整产品规格(如从 HBM3e 降到 HBM3 节省 30% 成本)。
  8. 中介层 IP 自研 vs 外购:TSMC 提供的参考中介层设计对大多数客户够用,但若希望最大化封装良率(>95%),建议自研中介层走 IP block 路径;成本约增加 8-12 个月开发周期。
  9. 散热设计余量:HBM4 12-Hi 单 stack 功耗约 15-20W(高于 HBM3e 的 8-12W),封装级散热设计必须升级到 vapor chamber 或冷板直贴。
  10. 测试机台锁定:NVIDIA 已锁定 Advantest V93000 系列 HBM 测试机台 2026-2027 产能 60%+;AMD 与中国厂商应在 2026 Q3 之前完成测试机台长约。
  11. CoWoS-L 良率监控:CoWoS-L 涉及局部硅互连 + RDL 双工艺,良率比 CoWoS-S 低 5-8 个百分点;建议每季度跟踪台积电嘉义厂的良率公开数据。
  12. HBM3e 8-Hi vs 12-Hi 选型:8-Hi 便宜 20% 且良率高 10%,但带宽低 25%;12-Hi 是 NVIDIA 强制规格;AMD MI400 据报道可接受 8-Hi。
  13. 2.5D vs 3D 封装权衡:昇腾 920C 与天数 80 据报道均采用国产 2.5D 中介层(非 CoWoS-L),是 HBM 国产化窗口期的过渡方案。
  14. 库存周转策略:HBM 单 stack 库存成本约 $200-400(按 HBM3e 12-Hi),AI 厂商 HBM 库存周转天数从 2024 年 45 天降到 2025 年 28 天,2026 H2 进一步降到 21 天——意味着供应链容错窗口极窄。
  15. 测试向量自研:HBM4 引入 active base die 后,BIST(Built-In Self-Test)向量必须自研;这是 NVIDIA 与 SK Hynix 长期合作的核心壁垒之一。
  16. 数据通路仿真:HBM4 的 PHY 仿真需要与先进逻辑制程的 SerDes 联合建模;建议在 2026 Q4 之前完成 28Gbps+ SerDes 仿真闭环。
  17. 国产 EDA 工具兼容:中国 AI 芯片厂商需验证国产 EDA(如华大九天、概伦电子)对 HBM4 PHY 的支持度;预计 2026 H2 国产 EDA 可覆盖 70% HBM3 设计,HBM4 仍主要依赖 Synopsys/Cadence。
  18. 废品回收与回流焊工艺:HBM 封装缺陷率约 3-5%,回流焊返修工艺的良率直接影响总成本;建议与封装厂联合开发专属回流焊曲线。

七、参考文献

  • TSMC 2025 Q4 Earnings Call Transcript(2026-01-16),台积电投资者关系页
  • SK Hynix HBM4 Announcement Press Release, 2026-03-04
  • TrendForce, "CoWoS Supply-Demand Outlook 2026 H2", 2026-05-22
  • BIS, "AI Diffusion Rule Interim Final", Federal Register Vol. 90, 2025-01-15
  • Wikipedia, "High Bandwidth Memory"(2026-06 访问)
  • Wikipedia, "TSMC"(2026-06 访问)
  • 集邦科技 TrendForce Memory Research 2026 Q2 Report

八、选这个角度的差异化论证

本文与近 14 天发布的 72 篇 AI 文章的主题词云做差异化对照:BIS 算力供应链(id=299 简述)、电力与 AI(id=278)、AI 估值(id=283) 都从外围维度切入过,但没有任何一篇从 CoWoS/HBM/国产替代三轴耦合的几何学角度展开。本文聚焦三轴交叉的 2026 H2 决策场景(HBM4 时间表 × CoWoS-L 复杂度 × 国产替代窗口期),提供可量化的产能数学(公式 1-3)与中国本土路径的三阶段时间表,区别于既有的"宏观趋势评论"类文章。

免责声明:本文 HBM 市场份额、CoWoS 产能数据来源截至 2026 Q2 公开报道与行业分析师估算;CXMT 等中国厂商的产能时间表为 未公开验证的猜想,引用时建议交叉对照官方年报与 BIS 出口许可清单。

相关文章

  • AI 训练数据的 2026 H2 枯竭临界点:合成数据、版权授权与公共域的三角博弈7月1日
  • 开源大模型的商业化悖论 2026:从 DeepSeek 现象到 Llama 闭源化的开源战略十字路口6月30日
  • 2026 H2 AI Safety 治理的全球三轨分化:当 RSP、Preparedness 与备案制的范式鸿沟撞上对齐研究人员的二次出走6月29日

评论

加载评论中…

发表评论

返回文章列表