2026.02.2010 min

三条路线 / 统一叙事的终结

两周。三家公司。

两周。三家公司。四个模型。

你的信息流又炸了一次。评论区在尖叫"一切都变了"。但这一轮真正的信号，不是谁跑分更高——而是这三家公司已经不在做同一张考卷了。

我们正在目睹一次文明级别的分岔：人类历史上最强大的三股技术力量，在同一个赛道上跑了两年之后，突然各奔东西。这不是产品策略的分歧。这是对"智能的瓶颈到底在哪"这个根本问题的三种截然不同的诊断。

"通用模型"的叙事正在碎裂。而碎裂本身，才是最重要的信号。

---

1. Anthropic：别跑分了，把工作流跑通

2月5日。Opus 4.6 发布。但标题不是模型本身——是 Agent Teams：在 Claude Code 内部编排的 AI 小队，能自动拆解任务、分配角色、协调执行。四种架构：Leader、Swarm、Pipeline、Watchdog。

模型层面的数据当然也有：ARC-AGI-2 从 37.6% 跃升至 68.8%，单代提升 31 个百分点——Opus 家族史上最大单次跳跃。百万级 token 上下文检索准确率 76.0%，同一测试 Gemini 3 Pro 只拿了 26.3%。

但纯编码能力（Terminal-Bench 2.0）是 65.4%，低于 GPT-5.3 Codex 的 77.3%。Anthropic 的优势不在代码生成速度——在于理解复杂的业务逻辑。

商业信号比跑分更响亮：Claude Code 六个月达到 10 亿美元 ARR，到二月翻倍突破 25 亿。公开 GitHub 提交中约 4% 来自 Claude Code。

Anthropic 的赌注：AI 商业化的瓶颈不是模型能力——是工作流编排。

这个判断背后有一个更深的洞察：能力已经溢出了。不是模型不够聪明，是没有人知道怎么把这种聪明组织起来、嵌入到真实的业务流程中去。

---

2. OpenAI：自研芯片，极致速度

2月12日。GPT-5.3 Codex Spark。OpenAI 第一个不跑在 Nvidia 硬件上的生产模型——完全部署在 Cerebras 晶圆级引擎上。推理速度 1,000+ tok/s，是传统 GPU 的 15 倍。

但速度有代价。Terminal-Bench 2.0：58.4%（完整版 Codex：77.3%）。上下文窗口缩至 128K。纯文本。

策略比产品重要。 背后是多年期的 Cerebras 合作（最高 750MW 算力），加上 AMD（6GW 协议）和 Broadcom（定制加速器）。整个行业正在从 Nvidia 单一文化走向芯片多元化。

OpenAI 的赌注：瓶颈不是推理深度——是延迟。

这是一个让人不太舒服的判断。它暗示的是：对于绝大多数用户来说，模型已经够聪明了，问题在于它回答得太慢、用起来太贵。如果推理速度提升一个数量级，AI 的使用场景会从"偶尔调用"变成"实时嵌入"——这才是真正的范式转移。

---

3. Google：别打代码战了，去解人类解不了的题

Google 在两周内打出了一记组合拳。2月12日：Deep Think 推理模式升级。2月19日：Gemini 3.1 Pro，把那种推理能力注入通用模型。

Deep Think 运行的是一种"System 2"架构——不是 token 级预测，而是暂停、评估多条逻辑路径、然后作答。ARC-AGI-2：84.6%，领先第二名 15.8 个百分点。

但昨天的 3.1 Pro 才是更大的棋步：把 Deep Think 的推理能力注入通用模型。16 项基准测试中 13 项领先。杀手级数据是价格：输入 $2 / 输出 $12 每百万 token——Opus 4.6 的七分之一。

Google 的赌注：瓶颈不是工作流——是推理深度。而关键是把这种深度变成基础设施级的便宜。

这是三家公司中最像传统科技巨头的打法：高端品牌占领心智，低价通用产品占领市场。Deep Think 在上面，3.1 Pro 在下面。品牌拉高度，价格拉规模。

---

4. 三种诊断，不可能都对——但可能不止一种是对的

让我们把三个赌注并排放在一起：

- Anthropic 说：瓶颈是编排。

- OpenAI 说：瓶颈是速度。

- Google 说：瓶颈是推理深度。

两年来，这三家公司在同一套基准测试上你追我赶。现在它们实质上放弃了正面比较。这不是偶然的差异化营销。每家公司对 AI 商业化的瓶颈做出了不同的诊断。

这件事本身就很值得玩味。它意味着"通用模型"的概念——一个模型在所有维度上都最强——正在从共识变成幻觉。

---

5. 芯片多元化：长期赌注，短期阵痛

Spark 证明了非 Nvidia 芯片可以提供极端的推理速度，但推理能力损失了 25%。真正的考验：Cerebras 能否在保持速度优势的同时缩小推理差距？

这里有一个更大的问题：过去十年，Nvidia 的 CUDA 生态系统是整个 AI 产业的公共基础设施。打破这种单一依赖，短期内必然带来碎片化的成本。但长期来看，任何健康的产业都不应该建立在单一供应商之上——这是工业史反复验证的铁律。

---

6. Agent 战争正式开打

Anthropic 的 Agent Teams。Google 3.1 Pro 在 APEX-Agents 上拿到 33.5%。OpenAI 同期推出的企业级 Agent 平台 Frontier。三家都在押注 Agent，但入口完全不同。

Agent 不是聊天机器人的升级版，而是工作方式的重新定义。它意味着 AI 不再是你去"使用"的工具，而是一个你"部署"的员工。这个转变的意义，远比任何一次跑分提升都要深远。

---

7. 分岔之后，你该怎么办？

你可能在想：三家公司，三条分岔路——我该押哪一条？

这个问题本身就问错了。

你不需要押注。你需要理解的是分岔本身意味着什么。

它意味着 AI 能力已经扩展到了这样一个地步：没有任何单一维度能产生绝对赢家。它意味着工具选择不再是"挑最强的"——而是"挑最适合你场景的"。

竞争性分岔意味着你身处买方市场。三家公司朝三个方向全力冲刺，最终的受益者是那个足够了解自己需求的人。

别试图跟上每一个模型。跟上你自己的工作流需求就够了。

我们在文章开头说，"通用模型"的叙事正在碎裂。但换一个角度看，碎裂未必是坏事。统一叙事的终结，恰恰是个体选择的开始。当所有人都挤在同一条路上时，你没有选择；当路分成三条时，你终于可以选那条属于你的。

Don't Panic. Accelerate.

← 上一篇

能力收敛 / 当代码写得一样好，战争才真正开始

验证回路 / 用《银翼杀手2049》拆解智能时代的真正稀缺资源

← 全部信号