DeepSeek-V4 今日正式发布：百万上下文、MegaMoE架构、全面开源

📚 本系列目录：《DeepSeek V4》当前第 1/2 篇 · 下一篇：DeepSeek-V4 深度研究报告：国产大模型的里程碑式突破

📚 系列导航

《DeepSeek V4》共 2 篇，本篇是第 1 篇。

2026年4月24日，DeepSeek 全新旗舰模型 DeepSeek-V4 预览版正式上线，并同步开源。这款历经多次跳票、承载业界极高期待的模型，终于在今天与全球开发者见面。

📐 超长上下文

DeepSeek-V4 支持 百万字（1M token）超长上下文，可处理整本书、超大代码库或长篇对话，彻底突破此前模型的上下文瓶颈。

🤖 Agent 能力全面跃升

在 Agent 能力、世界知识和推理性能上，DeepSeek-V4 均实现了国内与开源领域的领先，具备更强的工具调用、多步规划与自主执行能力。

⚡ 两个版本，覆盖不同场景

🏗️ MegaMoE 架构

V4 采用先进的 MegaMoE（Mega Mixture of Experts）架构，参数规模或达 1.6 万亿，单次推理可激活数千个专家，在性能与效率之间取得突破性平衡。

🇨🇳 全面适配国产算力

V4 全力适配华为昇腾芯片，通过 CANN 框架完成核心代码重写，是中国 AI 生态去 CUDA 化进程中的重要一步。

即日起，你可以通过以下方式使用 DeepSeek-V4：

DeepSeek-V4 的发布之路颇为曲折。从 2025 年底传出消息，到春节前后跳票，再到 4 月下旬研究员在社交平台发出「V4 下周」的预告，整个 AI 圈等待了将近半年。

等待的背后，是团队在技术上的极致追求——超长上下文的工程实现、MegaMoE 架构的系统优化、以及对国产算力的全面适配，每一项都是硬骨头。

V4 发布当日，A 股 AI 算力芯片概念股全线爆发，科创芯片 ETF 大涨近 3%，数字经济 ETF 涨 0.49%。市场用真金白银投票，表达对这款模型的信心。

对于开发者而言，一个支持百万上下文、Agent 能力领先、完全开源、且全面适配国产算力的模型，意味着更多可能性正在打开。

DeepSeek 官方 X（Twitter）账号：@deepseek_ai