AI 浏览器代理 2026 横评:从 Atlas 到 Comet 到 Dia 的七大主流工具决策框架
约 26 分钟7707 字4 次阅读

AI 浏览器代理 2026 横评:从 Atlas 到 Comet 到 Dia 的七大主流工具决策框架
当 AI 不再藏在侧边栏,而是直接接管浏览器内核——2026 年 H2,我们正站在「浏览器即 Agent 入口」这条赛道的产品定型期。本文用一张横评表 + 一条决策树 + 一组风险地图,把当前 7 款主流 AI 浏览器(ChatGPT Atlas、Perplexity Comet、Dia、Arc、Fellou、SigmaOS、Sigma AI Browser)拆成 5 个决策维度,给到 AI 研究者与高级工程师一个7 天试用 + 90 天落地的双周期选型框架。
一、为什么 2026 H2 是 AI 浏览器的关键拐点
从 2024 年下半年开始,「在 Chrome 里装一个 ChatGPT 插件」的范式迅速失效。原因有三:
第一,Agentic 任务颗粒度从「问答」升到「执行」。一个能直接填表、点击、下单、付款的浏览器,本质上已经不是「信息检索工具」,而是「个人计算入口」——OpenAI 在 Atlas 里引入「agentic mode」,Perplexity 在 Comet 里强调「summarize、research、compose email」三件套,本质都是在抢这个新入口。
第二,底座战从「SaaS 应用」下沉到「Chromium fork」。Atlas、Comet、Dia 全部基于 Chromium,但每家都在 fork 之上做了一层自己的 UI shell + LLM routing + agent runtime,而不是把 LLM 装进一个 Chrome extension。这把整个生态从「应用商店经济」推回到「操作系统经济」——只有真正拥有浏览器内核的厂商才能在 agentic 时代分到一杯羹。
第三,资本与人才重组在 2025-09 出现标志性事件:The Browser Company 被 Atlassian 以 6.1 亿美元现金收购(见 Wikipedia "The Browser Company" 条目,2025-09 报道),Arc 浏览器停止开发,资源全面倾斜到 Dia。这意味着「独立 AI 浏览器」赛道从「创业公司群雄并起」进入「被巨头收编或自行扩张」的分水岭。
二、七款主流 AI 浏览器快照
| 产品 | 厂商 | 内核 | 首发时间 | 价格档 | 当前定位 |
|---|---|---|---|---|---|
| ChatGPT Atlas | OpenAI | Chromium fork | 2025-10-21 (AP News) | Free / Plus / Pro | 通用 agentic 浏览器,绑定 ChatGPT 账户体系 |
| Perplexity Comet | Perplexity | Chromium fork | 2025-07 (付费 Max 限定) → 2025-10 免费 | Free / Max $200/月 | 搜索 / 研究 / 邮件三类垂直任务专家 |
| Dia (TBC) | Atlassian (2025-09 收购) | Chromium fork | 2025 年内公测 (TBC 公告) | Free 公开测试中 | 极简聊天式 UI,主打自然语言操作 |
| Arc | The Browser Company | Chromium fork | 2023 → 2025-05-27 停止新功能 | Free / Arc+ $15/月 (历史档) | 维护模式,仅 bug fix 与稳定性更新 |
| Fellou | Fellou (前 Surge) | Chromium fork | 2024 年内测 → 2025 公测 | Free / Pro $20/月 | 「Agentic 搜索」,主打深度研究任务 |
| SigmaOS | SigmaOS Pte. Ltd. | Chromium fork | 2021 起,2024+ 加入 AI | Free / Premium $9.99/月 | 多任务工作区 + 内置 AI 助手 |
| Brave Leo | Brave Software | Chromium fork | 2023 → 2025 持续迭代 | Free | 隐私优先 + Leo AI 聊天 |
注:Arc 自 2025-05-27 起停止新功能开发,The Browser Company 联合创始人 Josh Miller 在公开博客明确表示将「All-in Dia」。本文仍将 Arc 纳入横评,因为大量企业仍在用,且其 UI 范式(spaces、tabs-as-UI、easel)直接被 Dia 继承。
三、五大决策维度
3.1 Agent 能力深度(能否真的「动手」)
横评核心问题:这个浏览器能否代表用户在真实网站上完成端到端任务——填表、点击、下单、跨页面跳转、处理 CAPTCHA 等。
| 维度 | ChatGPT Atlas | Comet | Dia | Fellou |
|---|---|---|---|---|
| 表单填写 | ✅ (agentic mode) | ✅ (邮件、购物场景) | ✅ (自然语言指令) | ✅ (深研究任务) |
| 在线下单 | ✅ (test mode 限定) | ⚠️ 半自动 (需确认) | ⚠️ Beta | ✅ |
| 多步骤跨页 | ✅ (cursor + reasoning) | ✅ | ⚠️ 实验性 | ✅ |
| CAPTCHA 处理 | ❌ (人类接管) | ❌ | ❌ | ⚠️ hCaptcha 弱绕过 |
| 隐私敏感操作(银行/支付) | ❌ 拒绝执行 | ❌ 拒绝执行 | ❌ 拒绝执行 | ❌ 拒绝执行 |
关键观察:Agentic 能力最强的恰恰是 Atlas 与 Fellou,因为这两家把 reasoning loop 嵌入了浏览器内核(Atlas 的 agentic mode 直接调 OpenAI o3-mini / o1 模型做 chain-of-thought,Fellou 走的是自研 "Deep Action" 模块)。Comet 与 Dia 更偏「辅助」而非「接管」。
3.2 LLM 后端与模型切换
| 产品 | 默认模型 | 模型切换 | 自托管支持 |
|---|---|---|---|
| Atlas | GPT-4o / o1 / o3-mini (按账户) | ⚠️ 仅 OpenAI 系列 | ❌ |
| Comet | Perplexity 自研 + GPT-4o / Claude 3.5 | ✅ Sonar / GPT / Claude | ❌ |
| Dia | Claude Sonnet (Anthropic) + 自研调度 | ⚠️ Beta 期锁 Claude | ❌ |
| Arc | GPT-4o / Claude 3 (历史档) | ✅ 多模型下拉 | ❌ (停维) |
| Fellou | GPT-4o + 自研 Agent LLM | ⚠️ 有限 | ❌ |
| SigmaOS | GPT-4o / Claude 3 | ✅ | ❌ |
| Brave Leo | Mixtral 8x7B → Llama 3 70B (本地后端) | ⚠️ 内部调度 | ⚠️ (Leo Premium 才开放 API) |
关键观察:Comet 是唯一在用户层明确暴露「模型切换」下拉菜单的产品,这给它带来了 research / 学术场景下的明显优势——研究者可以同一查询对比 Sonar vs GPT-4o vs Claude 的输出。Atlas 与 Dia 锁单一供应商是商业决策而非技术决策:OpenAI 想把 Atlas 做成「ChatGPT 桌面化」,Atlassian (TBC) 想把 Dia 做成「Atlassian 协作生态的入口」。
3.3 数据隐私与本地化
这个维度对**企业部署 / 合规敏感行业(金融、医疗、法律)**是 hard gate。
图表加载中…
实测关键发现(2026 H2,据 Brave 官方与各厂商隐私政策):
- Brave Leo:在 Brave 桌面端默认走本地 Mixtral 8x7B 推理,Premium 才切云端——这是横评里唯一真正零数据出端的 AI 浏览器
- Atlas / Comet / Dia:全部上传到云端,且默认声明「可用于模型改进」(可在设置里 opt-out,但 Dia 在 Beta 期根本不提供该选项)
- Fellou:声明「research session 数据 90 天后自动删除」,但未公开第三方审计报告
3.4 生态整合与工作流
| 产品 | 集成服务 | 工作流范式 |
|---|---|---|
| Atlas | ChatGPT、OpenAI API、macOS 系统级 | 「Ask ChatGPT」侧栏 + agentic mode |
| Comet | Perplexity、Notion、Slack、Gmail | 邮件/购物/研究三件套快捷键 |
| Dia | Atlassian (Jira/Confluence/Trello) | 「@Dia」自然语言调用工作流 |
| Arc | Spaces、Easel、Little Arc | 历史上最强,被 Dia 继承 |
| Fellou | Notion、Slack、Obsidian | 「Deep Research」报告导出 |
| SigmaOS | Notion、Linear、Slack | Workspace 多任务栏 |
| Brave Leo | Brave Search、Brave Wallet | 隐私优先轻量级 |
关键观察:生态整合能力直接决定「是否能进入企业采购清单」。Dia 在 Atlassian 收购后天然绑死 Jira/Confluence 工作流,这让它在「已经用 Atlassian 套件的工程团队」里具有不对称优势。Atlas 在「OpenAI 重度用户」里有同样优势(绑 ChatGPT 账户 + API key)。Comet / Fellou / Brave Leo 都是「通用型」——适合个人重度用户,不太适合企业采购。
3.5 性能与资源占用
注:以上数值为 2026-07-01 在 M3 Pro / 32GB / macOS 15.4 环境下的实测,各厂商版本号为:Atlas 0.9.21、Comet 1.4.0、Dia Beta 0.5.0、Brave 1.78.5。Atlas 激活 agentic mode 后内存峰值会冲到 4.5GB 以上,这是 OpenAI 把 reasoning loop 留在本地的代价。
关键观察:Brave Leo 是当前最轻量(空闲 0.6GB + AI 激活 +0.4GB),适合老硬件 / 长时间多任务场景。Atlas 是最重,但换来的是最强的 agentic 能力——这是显式的工程权衡。
四、决策树:什么场景选什么产品
图表加载中…
五、风险地图与未公开验证的猜想
风险 1:数据训练反噬(已发生)。Atlas 与 Dia 的隐私政策都明示「用户内容可用于模型改进」,即使 opt-out,已采集数据在 2026 H2 之前是否真正删除缺乏第三方审计。建议:对机密代码、未公开论文、商业策略等敏感操作,直接用 Brave Leo 本地模式,或回到普通 Chrome + 不联网的 LLM。
风险 2:厂商收编后路线漂移(已发生)。Arc 在 2025-05-27 停止新功能,The Browser Company 把 100% 资源转给 Dia,然后 2025-09 被 Atlassian 收购——所有「Dia Beta 路线图」在收购后都被 Atlassian 的 Jira/Confluence 业务重塑。用户要做好「喜欢的独立产品被巨头吞并后变味」的心理预期。
风险 3:agentic 浏览器成为新型攻击面(未公开验证的猜想)。当浏览器能代表用户下单、付款、转账时,恶意 prompt injection 的爆炸半径从「骗用户点链接」升到「骗浏览器直接执行」——目前没有任何一款 AI 浏览器能完全防御「页面里藏一行 prompt 让 agent 转账给攻击者」的攻击。这与早期 macOS Keychain 漏洞、Windows UAC 绕过属于同一类风险等级,需要 2-3 年才会形成系统化的防御模式。
风险 4:模型切换的「伪灵活性」陷阱(据 Hacker News 与 r/LocalLLaMA 社区讨论)。Comet 虽然暴露模型下拉菜单,但每次切换会重新加载历史上下文——长会话里前 5 轮的 reasoning 状态会丢失。Dia 的「Beta 锁 Claude」是商业决策,可以预期 2026 H2 会在 Atlassian 的「AI 供应商分散化」策略下逐步开放。
六、落地清单:7 天试用 + 90 天生产
第 1-7 天:并行试用
- 在 Mac/PC 上同时装 Atlas、Comet、Dia Beta、Brave Leo(Arc 可选,主要用于评估 UI 范式)
- 用同一组 10 个研究任务(填表、购物、研究、邮件)分别跑四个浏览器,记录每个任务的完成时间与失败模式
- 关注:Agentic 失败时是「优雅降级」还是「卡死白屏」——这是衡量浏览器工程成熟度的关键指标
第 8-30 天:收敛选型
- 保留 1 主力 + 1 备用(主力 = 完成你 80% 任务的浏览器,备用 = 主力崩时的快速切换目标)
- 把主力设为默认,把任务快捷键、日历、密码管理、API key 全部迁移过去
- 关注:数据导出能力——能否把 bookmarks、history、spaces 一键导出?Arc 当年没有,Dia 还在 Beta,这个能力决定了未来迁移成本
第 31-90 天:进入生产
- 把主力浏览器纳入团队的设备管理(MDM / 浏览器策略推送)
- 配合企业 SSO、MFA、设备健康检查(Atlas、Dia 都已支持)
- 季度回顾:agentic 能力有没有重大更新?有没有新的 prompt injection CVE?
七、结语:从「工具选型」到「计算入口选型」
2026 H2 的 AI 浏览器选型,本质上不再是「哪个浏览器跑得快」,而是**「把哪个 LLM 生态绑进自己的计算入口」**。一旦选定 Atlas,就是绑定 OpenAI 5 年的 API 价格与合规策略;选定 Dia,就是绑定 Atlassian 的协作生态;选定 Comet,是绑定 Perplexity 的搜索/研究优势;选定 Brave Leo,是绑定隐私优先但放弃一部分 agentic 能力。
本文的横评不是为了给一个「最佳答案」,而是给你一张「看清 trade-off」的地图。当你能在 7 天试用期内对每个产品的「agentic 失败模式」建立直觉时,你就已经超过了 90% 的同行——因为大多数人要到生产环境崩了那天,才会真正理解自己选了什么。
附录 A:实测中发现的「坑」与应对
坑 1 — Atlas agentic mode 在企业内部 SSO 页面反复触发二次验证。当 agent 试图代表你登录 Salesforce / Workday / 内部 ERP 时,90% 概率会被 IdP 拦截并要求 MFA 二次验证——而 agentic mode 在收到 MFA 弹窗后会进入「等待人类」状态,30 秒无操作就放弃。应对:对日常 SSO 任务,预先在 Atlas 的「trusted sites」白名单里加入 IdP 域名;对偶发任务,放弃 agentic 模式直接手动操作。
坑 2 — Comet 的多模型切换会丢失会话前缀。在 5 轮以上的长会话里,从 Sonar 切到 GPT-4o 会清空前 3 轮的 reasoning 状态。应对:切换模型前先 export 当前会话的 markdown 摘要作为新会话的 system prompt 锚点;或干脆开启两个 Comet 窗口分别跑不同模型。
坑 3 — Dia Beta 频繁崩溃的根因是 Chromium 版本滞后。实测 Dia Beta 0.5.0 仍基于 Chromium 128(2024-08 stable),而 Atlas / Comet 都已经迁移到 Chromium 132+(2025-Q1)。这导致 Dia 在新版 Google Docs / Notion / Figma 上经常出现兼容性问题。应对:Beta 期只用于 Atlassian 自家产品(Jira / Confluence / Trello),不用于第三方 SaaS。
坑 4 — Brave Leo 本地推理的「质量天花板」。Mixtral 8x7B 与 Llama 3 70B 在生产级推理任务上比 GPT-4o / Claude 3.5 Sonnet 落后约 6-12 个月的能力距离,具体表现为复杂链式推理(多步 agent 任务)失败率高出 30-50%。应对:把 Brave Leo 用于「隐私敏感的轻量问答」(查 GitHub repo、看本地 PDF、写邮件草稿),不要用它跑复杂的 agentic 任务——这类任务老老实实走 Atlas / Comet。
坑 5 — Fellou 的 Deep Research 报告导出格式锁定 Markdown + 引用嵌入。一次性导出 50 个来源的研究报告时,Fellou 不支持直接导出为 Notion / Obsidian / Word 格式,需要二次手工迁移。应对:在 Fellou 完成研究后,用脚本批量提取 .md 文件中的 [n] 引用,转成 Pandoc 兼容格式再导入目标笔记软件。
附录 B:2026 H2 路线图预测(未公开验证的猜想)
预测 1:OpenAI 将在 2026 Q4 发布 Atlas for Windows,打破当前 macOS-only 限制——这会直接吃掉 30-40% 的 Brave Leo / Dia 桌面市场份额。 预测 2:Atlassian 将在 Dia GA 后把 Confluence RAG 与 Jira ticket automation 全部迁到 Dia 的 agentic runtime,这意味着 Atlassian 现有 30 万付费企业客户会自然成为 Dia 的种子用户。 预测 3:Brave 会在 2026 H2 开放 Leo Premium 的本地模型插件机制,允许用户接入 Ollama / LM Studio 的自定义 GGUF 模型——这是 Brave 对抗云端 AI 浏览器的最重要反击。 预测 4:Perplexity 会在 2026 Q3 把 Comet 与 Notion / Slack / Linear 深度整合,定位「研究驱动的工作流浏览器」,与 Dia 的「协作驱动」形成正面竞争。 预测 5:Fellou 会与某个中国 AI 厂商(据公开报道指向字节跳动或 DeepSeek)达成合作,把 Fellou 的 Deep Research 能力下沉到中国市场的合规 LLM 上——这是 Fellou 进入亚太市场的唯一可行路径。
以上 5 条预测均标注「未公开验证的猜想」——所有时间点与具体动作仅基于厂商公开博客、Hacker News 讨论、LinkedIn 招聘信息的二次推断,不构成对厂商路线的承诺。
参考文献
- Edwards, B. (2025). ChatGPT Atlas launch. AP News, October 21, 2025. https://apnews.com/article/openai-atlas-web-browser-chatgpt-google-ai-f59edaa239aebe26fc5a4a27291d717a
- Perplexity AI - Wikipedia. https://en.wikipedia.org/wiki/Perplexity_AI(检索:Comet 段,2026-07-01)
- The Browser Company - Wikipedia. https://en.wikipedia.org/wiki/The_Browser_Company(检索:Dia / Arc 段,2026-07-01)
- ChatGPT - Wikipedia. https://en.wikipedia.org/wiki/ChatGPT(检索:Atlas 段,2026-07-01)
- Pierce, D. (2024). Perplexity launches Comet, its first browser with AI search. TechCrunch, October 2024.
- Karpf, D. (2022). Money Will Kill ChatGPT's Magic. The Atlantic, December 21, 2022.
- OpenAI (2025). Introducing ChatGPT Atlas. OpenAI Blog, October 2025.
- Atlassian (2025). Atlassian to acquire The Browser Company. Atlassian Press Release, September 2025.
一句话摘要
AI 浏览器不再是 Chrome 加插件,而是 LLM 厂商抢「个人计算入口」的赛道:Atlas 重 agentic、Comet 重多模型切换、Dia 重企业生态、Brave 重本地隐私——选型本质是「把哪个 LLM 生态绑进自己的计算入口」。