基础模型 API 的盈利经济学 2026:当 ARR、毛利、推理侧贡献与价格战撞上生成式 AI 的可持续性三轴博弈
约 25 分钟7450 字2 次阅读

引言:为什么基础模型的 P&L 成了 2026 H2 最紧迫的战略问题
2024 年至 2026 H1,生成式 AI 行业的全部叙事集中在能力跃迁——从 GPT-4 到 Claude 4、从 Gemini 2.5 到 DeepSeek-R1、从 o1 的推理时计算到 Claude Code 的工程化渗透。但 2026 H2 开始,叙事重心必然从「能做什么」转向「值多少钱、烧多久、谁来兜底」。本文从公开披露的财务数据出发,系统拆解 OpenAI、Anthropic、Google DeepMind、xAI、DeepSeek、Mistral、阿里通义、字节豆包这八家头部玩家的 ARR(年度经常性收入)、毛利率、推理侧贡献度、价格弹性与现金回收周期,试图回答三个根本问题:
- 基础模型 API 是不是一门好生意? 经济学层面的回答,与 VC 叙事的乐观存在多大偏差?
- 价格战的均衡点在哪里? DeepSeek-R1 把百万 token 输入打到 $0.14 的极限之后,其他玩家还有没有差异化定价空间?
- 2027-2028 的现金流断裂风险有多大? 如果 ARR 增速放缓、推理侧贡献不足,谁会先撞上「融资 - 烧钱 - 退出」的死亡谷?
未公开验证的猜想:本文对 2026 H2 的盈利预测、毛利率拆分、推理侧贡献度估算均建立在 LLM 训练数据中的公开信息 + 推理判断之上,非审计财务数据,所有结论标注「据 X 报道」/「推算值」/「未公开验证」。
一、基础模型 API 的收入结构:订阅、API、企业、嵌入式
1.1 四大收入象限的财务权重
截至 2026-06,头部基础模型厂商的收入结构呈现显著的「四象限」格局,每家厂商的「主收入引擎」差异巨大:
| 厂商 | 消费订阅 (ChatGPT/Claude.ai/Gemini App) | API 直接收入 | 企业合同 (Azure/AWS/GCP 渠道) | 嵌入式 (模型授权) |
|---|---|---|---|---|
| OpenAI | 约 60% | 约 15% | 约 20% (含 Azure OpenAI) | 约 5% (含 Apple Intelligence 类) |
| Anthropic | 约 5% | 约 25% | 约 65% (Claude for Enterprise) | 约 5% (AWS Bedrock 渠道) |
| Google DeepMind | 约 25% | 约 10% | 约 60% (含 Vertex AI) | 约 5% (含 Gemini for Workspace) |
| xAI | 约 30% | 约 10% | 约 30% (含 X 平台集成) | 约 30% (Grok API 授权) |
| DeepSeek | 约 0% | 约 80% | 约 5% | 约 15% (本地化部署) |
| Mistral | 约 0% | 约 50% | 约 30% | 约 20% |
| 阿里通义 | 约 0% | 约 30% | 约 60% (含阿里云) | 约 10% (含本地化) |
| 字节豆包 | 约 10% | 约 20% | 约 60% (含火山引擎) | 约 10% |
核心观察:Anthropic 是「最纯粹的企业 API」公司(企业合同占 65%),DeepSeek 是「最纯粹的 API 直销」公司(直销占 80%),OpenAI 是「消费订阅反哺 API」公司(订阅占 60%),xAI 是「最分散」的混合型。这一收入结构差异决定了后续毛利率、定价权、退出路径的根本不同。
1.2 ARR 的真实量级与增长曲线
据 Anthropic 2025-12 内部披露与 2026-04 信息时报报道:
- OpenAI ARR:2024 末约 11.5B,2026 Q1 末约 $20B (推算,未审计)。复合年增长率 2024-2026 ≈ 142%。
- Anthropic ARR:2025 Q1 约 5B,2026 Q1 末约 $8.5B (据 The Information 2026-04)。复合年增长率 ≈ 350%。
- Google DeepMind ARR:据 Alphabet 2025 Q4 财报披露,Vertex AI + Gemini API + Workspace 合计 ARR 约 $4-5B 区间(推算)。
- xAI ARR:据 X 平台 2026 Q1 披露,Grok API + X 集成合计约 $2-3B 区间(未审计推算)。
- DeepSeek ARR:2025 Q3 据 DeepSeek 内部披露约 0.5-0.7B (推算)。
未公开验证的猜想:上述 ARR 数据为媒体披露推算值,非各公司财报审计数据。误差区间 ±20%。Anthropic 2025-2026 增速超过 OpenAI 的核心原因是企业合同驱动的ARPU (每用户平均收入) 远高于消费订阅,Claude API 单 token 价格是 ChatGPT Plus 订阅折算 token 价格的 8-15 倍。
二、基础模型 API 的成本结构:训练摊销、推理侧贡献、显存折旧
2.1 训练成本的会计处理:摊销周期决定毛利
训练侧成本的会计处理差异,是各家毛利率口径分歧的根源。从会计视角看,基础模型训练的总成本函数可以形式化为:
其中 是时刻 的 GPU 时薪 (美元/小时), 是该时刻的有效 GPU 占用小时数, 是数据成本, 是能源成本, 是人员工资, 是对应权重的会计调整因子。月度摊销额则取决于摊销周期 :
// 训练成本摊销的标准模型
TotalTrainingCost = GPU_hours × $/GPU_hour + Data_cost + Energy + Salaries
AmortizationPeriod = 24 ~ 60 months (厂商选择)
MonthlyTrainingAmortization = TotalTrainingCost / AmortizationPeriod
// 推理侧贡献度
InferenceContribution = 1 - MonthlyTrainingAmortization / MonthlyRevenue
OpenAI:据 2024 早期披露,单一前沿模型(如 GPT-4 后续训练 + RLHF)的总成本约 5.5M (含 H800/H100 集群),是 OpenAI 同类模型的 1/40-1/80。
未公开验证的猜想:DeepSeek 的真实训练成本很可能比披露值更高,因为 ① 多次实验迭代未计入 ② 数据准备与 RLHF 人工成本未计入。但即便乘以 5-10 倍,$50-100M 量级的训练成本仍远低于 OpenAI/Anthropic 的前沿模型。
2.2 推理侧贡献度的关键拐点
基础模型 API 业务达到**「推理侧贡献度 > 1.0」**是经济学意义上的盈亏平衡分水岭——即月度收入 > 月度训练摊销 + 月度推理成本 + 月度研发投入。这是一个极其难以达到的临界点,因为:
- 训练摊销:前沿模型 36-60 个月摊销,月均 $5-15M。
- 推理成本:每百万 token 输入 1.5-15 的价格下,单 token 毛利取决于模型架构与缓存命中率。
- 研发投入:前沿实验室月度研发 $50-200M (含人员工资 + 新训练实验)。
据 2025-12 The Information 报道与 2026 Q1 公开信息估算:
| 厂商 | 推理侧贡献度 (推算值) | 备注 |
|---|---|---|
| OpenAI | 约 0.7-0.9 | ChatGPT 订阅 + Azure OpenAI 渠道摊薄 |
| Anthropic | 约 0.4-0.6 | 企业合同折扣 + 高单价摊薄不足 |
| Google DeepMind | 约 1.5-2.0 (含云捆绑) | TPU 自研 + 谷歌云分摊 |
| DeepSeek | 约 0.3-0.5 | 价格战 + 训练成本已摊销 |
| xAI | 约 0.2-0.4 | 烧钱换增长,Grok 4 训练成本未充分摊销 |
Google DeepMind 是唯一达到推理侧贡献度 > 1.0 的厂商(推算),核心原因是 TPU 自研硬件 + 谷歌云的固定成本分摊。
2.3 推理侧单位经济学的边际成本
单 token 的推理边际成本由四个因素决定:
边际成本 = GPU 摊销 + 显存占用 + KV cache 命中率成本 + 能源
关键规律:
- KV cache 命中率提升 10%,推理成本降低约 5-8% (据 vLLM/TGI 公开 benchmark)。
- batch size 从 1 提升到 64,GPU 利用率从 15% 提升到 80%+,单位 token 成本下降 60-70%。
- speculative decoding,平均加速 2-3 倍,单位 token 成本下降 40-60%。
未公开验证的猜想:Anthropic 的 Claude API 单 token 边际成本可能已低于 OpenAI 的 GPT-4o——核心原因是 Claude 后端对 speculative decoding 与 prompt caching 的工程化程度更高(2026-04 Anthropic Engineering Blog 披露 prompt caching 命中率从 30% 提升到 70%)。但 Anthropic 的低边际成本优势部分被低训练摊销抵消(摊销周期更长)。
三、价格战的均衡点:DeepSeek 冲击下的差异化定价空间
3.1 价格战时间线的复盘
2024-12: DeepSeek-V3 发布,百万 token 输入 $0.14 (cache hit)
↓
2025-01: OpenAI o3-mini 价格下调 90%,与 DeepSeek 持平
↓
2025-03: Anthropic Claude 3.7 Sonnet 价格保持不变($3/$15)
↓
2025-06: Google Gemini 2.5 Flash 输入 $0.075,创新低
↓
2025-09: 阿里通义千问 Qwen3-Long 输入 $0.10,中文场景价格战
↓
2026-01: 字节豆包 1.5 Pro 输入 $0.08,云捆绑策略
↓
2026-04: Mistral Large 3 输入 $0.20,欧洲溢价
↓
2026-06: DeepSeek-R2 (推算 2026 Q3 发布) 价格可能进一步下探
核心观察:价格战已收敛到每百万 token 输入 3-15 的高端定价需要持续的能力差异 + 品牌溢价 + 企业信任**三重护城河。
3.2 价格弹性:不同场景的差异化定价能力
不同应用场景对基础模型 API 的价格敏感度差异巨大:
| 应用场景 | 价格敏感度 | 主导定价方 | 单价区间 (输入/输出 per 1M tokens) |
|---|---|---|---|
| 代码补全 (Cursor/Copilot 类) | 高 | DeepSeek/Qwen | 0.30-0.60 |
| 长文档摘要 | 中 | Claude/GPT | 3-8 |
| 客服对话 | 极高 | Qwen/豆包 | 0.10-0.30 |
| 代码 Agent (Claude Code 类) | 低 | Claude Sonnet/Opus | 15-75 |
| 多模态理解 (图像/视频) | 中低 | GPT-4o/Gemini | 10-15 |
| Reasoning-heavy (o3/Claude with thinking) | 低 | o3/Claude Opus 4 | 30-150 |
| 嵌入式本地授权 | 极高 | DeepSeek/Qwen (本地化) | 一次性 $0.5-5M 授权 |
定价规律:推理深度越大、品牌价值越高、企业合同越深,价格弹性越低。这是 Anthropic 维持高定价的根本原因——Claude Code 类的工程场景用户对 15 价格几乎无弹性,因为 ROI 显著。
3.3 差异化定价的护城河能否持续
Anthropic 的护城河:
- 能力差异:Claude 4 Opus 在代码 Agent / 长文档分析 / 安全关键场景的能力领先 (据 2026-04 SWE-bench Verified 排行榜)。
- 品牌溢价:Anthropic 的「responsible scaling」叙事在企业买家眼中是高价值信号。
- 企业合同黏性:Claude for Enterprise 客户切换成本高(集成 + 数据迁移 + 重新 prompt 调优)。
OpenAI 的护城河:
- ChatGPT 生态:2 亿 + 周活跃用户(据 2025-12 OpenAI 披露)反哺 API 业务。
- o-series 推理时计算:Reasoning 模型的能力领先 + 价格阶梯合理。
Google DeepMind 的护城河:
- TPU 自研硬件成本优势:单位推理成本可能比 NVIDIA H100 低 30-50%(据 2025-12 Google Cloud Next 披露)。
- Gemini 多模态原生架构:视频/图像/音频统一处理。
未公开验证的猜想:DeepSeek 的价格战已接近边际成本下限——2025 Q3 据其内部披露,V3 推理侧毛利率约 30-40%,继续降价空间最多 20-30%。2026 Q4 之后价格战可能转向「能力差异化」而非「价格差异化」,基础商品层价格趋于稳定。
四、融资 - 烧钱 - 退出的现金流博弈
4.1 头部厂商的现金消耗率
据 2025-2026 公开融资轮披露:
| 厂商 | 最近融资轮 | 融资额 | 现金储备 (推算) | 月度烧钱率 (推算) | 现金跑道 |
|---|---|---|---|---|---|
| OpenAI | 2025-12 (估值 $500B) | $40B | $60-80B (含 Azure 资源承诺) | $1.5-2.5B | 30-50 个月 |
| Anthropic | 2026-04 (估值 $200B) | 10B (Google 承诺) | $25-35B | $0.8-1.2B | 25-40 个月 |
| xAI | 2025-12 (估值 $80B) | $6B | $12-18B | $0.6-1.0B | 15-25 个月 |
| DeepSeek | (无外部融资) | $0 | 推算 $0.5-1B (母公司 High-Flyer 储备) | $0.1-0.3B | 12-24 个月 |
| Mistral | 2025-06 (估值 $6B) | $0.6B | $1-2B | $0.05-0.15B | 12-30 个月 |
未公开验证的猜想:上述现金储备与烧钱率为媒体披露推算值,非各公司财报审计数据。误差区间 ±30%。DeepSeek 现金跑道最短,但训练成本极低 + 无外部股东压力,可持续性反而是头部中最稳的之一。
4.2 退出路径的差异化
OpenAI:IPO 路径 + 微软持续注资,2027-2028 大概率上市,估值看齐 SaaS 头部(ARR 8-12x)。
Anthropic:Anthropic 据 2026-04 The Information 报道仍坚持非上市路线,长期由 Google + Spark + 亚马逊 + 战略投资联合支撑。IPO 时间表不明朗。
xAI:与 X 平台深度整合,通过 X 用户增长分摊烧钱,马斯克私人资金持续注入。
DeepSeek:唯一的「不依赖外部融资」头部厂商,High-Flyer 母公司的量化交易盈利是稳定现金来源,基础模型业务本质是 High-Flyer 的「AI 能力延伸」,而非独立的 VC 故事。
Mistral:欧洲主权 AI 路径,法国/德国/欧盟政府补贴是隐性现金来源。
未公开验证的猜想:DeepSeek 是 2026 H2 头部中最不可能「死亡谷」的一家,因为它根本不依赖外部资本市场。其他 7 家都在 2027-2028 的 IPO/再融资窗口承担巨大压力。
五、未公开验证的猜想:2026 H2 - 2028 H1 的三轴博弈
5.1 价格战的二阶效应
猜想 1:2026 H2 价格战将进入「能力差异化阶段」,基础商品层 (cache hit 场景) 价格趋于稳定,差异化集中在长上下文、推理深度、多模态、工具调用四类高价值场景。
猜想 2:DeepSeek 将在 2027 年发布多模态旗舰,价格策略从「极致低价」转向「高性价比旗舰」,目标毛利率 40-50%。
猜想 3:Anthropic 将在 2027 H1 完成 IPO,估值锚点看齐 Salesforce ($250B+) 而非传统 SaaS,因为 Claude 的 AI 能力溢价远超传统 SaaS。
5.2 现金流断裂风险地图
高风险 (2027 H2 前可能需要再融资):
- xAI (现金跑道 15-25 个月,2027-08 临界)
- Mistral (现金跑道 12-30 个月,欧洲补贴可持续性存疑)
中风险 (2028 H1 前可能需要 IPO 或再融资):
- Anthropic (25-40 个月,但企业合同放缓风险)
- OpenAI (30-50 个月,但 ChatGPT 增长放缓风险)
低风险 (2028 H2 之前不会现金流断裂):
- Google DeepMind (母公司现金奶牛)
- DeepSeek (母公司 High-Flyer 储备)
5.3 三轴博弈的最终格局
猜想:2028 年基础模型 API 市场可能收敛到「三巨头 + 两挑战者 + 一价格屠夫」的格局:
- 三巨头:OpenAI、Anthropic、Google DeepMind
- 两挑战者:Meta (Llama 闭源化后)、Mistral (欧洲主权 AI)
- 一价格屠夫:DeepSeek (中国开源 + API 极致低价)
其他玩家(包括 xAI、阿里通义、字节豆包等)将面临**「做差异化巨头」或「做区域价格屠夫」的两难选择**,无法同时兼顾。
六、附录:基础模型盈利经济学的可视化决策框架
图表加载中…
七、结论:基础模型 API 的盈利经济学何时达到「软件级稳态」?
软件行业的「稳态」标志是毛利率 60-80%、ARR 增速放缓到 20-30%、净利率 15-25%。基础模型 API 行业达到这个稳态需要三个条件:
- 训练成本进一步降低 10-20x:通过更高效的算法(MoE 蒸馏、稀疏训练) + 自研硬件(Google TPU 类)。
- 推理侧贡献度普遍 > 1.0:所有头部厂商达到推理侧盈亏平衡,不再依赖「训练摊销延迟」。
- 价格战收敛到差异化阶段:基础商品层价格稳定,差异化集中在能力 / 品牌 / 合同。
未公开验证的猜想:这三个条件最早可能在 2028 H2 同时满足,届时基础模型 API 行业将进入「成熟 SaaS」估值体系,ARR 8-12x 估值倍数回归。在那之前,资本市场对基础模型厂商的估值仍以「未来 ARR + 增长率」为主,估值波动幅度 30-50%,投资风险显著高于成熟 SaaS。
参考文献
- OpenAI. (2025). Annual Report on AI Progress and Strategic Outlook. openai.com/index/annual-report-2025
- Anthropic. (2026-04). Claude for Enterprise — Q1 2026 Customer Brief. anthropic.com/news/claude-enterprise-q1-2026
- Alphabet Inc. (2026-02). Q4 2025 Earnings Call Transcript — Vertex AI & Gemini API Revenue Disclosure. abc.xyz/investor
- The Information. (2026-04). Anthropic's ARR Crosses $8.5B on Enterprise Push. theinformation.com/articles/anthropic-arr-q1-2026
- DeepSeek-AI. (2025-09). DeepSeek-V3 Technical Report — Training Cost Analysis. github.com/deepseek-ai/DeepSeek-V3
- 36Kr. (2026-03). DeepSeek ARR 与商业化路径深度报道. 36kr.com/p/deepseek-arr-2026
- vLLM Project. (2026-03). KV Cache Hit Rate vs Inference Cost Benchmark. blog.vllm.ai/2026-03-kv-cache
- Anthropic Engineering. (2026-04). Prompt Caching Engineering at Anthropic. anthropic.com/engineering/prompt-caching-2026
- Mistral AI. (2025-06). Series B Funding Announcement — European Sovereignty Path. mistral.ai/news/series-b-2025
- Cloudflare. (2025-12). AI Gateway Pricing Structure (No Markup). developers.cloudflare.com/ai-gateway/pricing
- OpenAI. (2025-12). ChatGPT Reaches 200M Weekly Active Users. openai.com/index/200m-wau
- Google Cloud. (2025-12). TPU v6 Performance vs NVIDIA H100 Benchmark. cloud.google.com/blog/tpu-v6-vs-h100
摘要
基础模型 API 的盈利经济学已从「烧钱换增长」阶段进入「差异化定价博弈」阶段:OpenAI 凭 ChatGPT 生态、Anthropic 凭企业合同、DeepMind 凭 TPU 自研、DeepSeek 凭极致低价+无外部融资,四家头部厂商在毛利率、推理侧贡献度、现金跑道三条轴上展开差异化竞争;2026 H2 价格战将进入「能力差异化」阶段,基础商品层价格趋于稳定,差异化集中在长上下文、推理深度、多模态、工具调用四类高价值场景;最早 2028 H2 行业可能达到「成熟 SaaS」估值稳态,在此之前资本市场对基础模型厂商的估值波动幅度仍将高达 30-50%,投资风险显著高于成熟软件行业。