返回DON'T PANIC
2026.02.2010 min

三条路线 / 统一叙事的终结

两周。三家公司。

两周。三家公司。四个模型。

你的信息流又炸了一次。评论区在尖叫"一切都变了"。但这一轮真正的信号,不是谁跑分更高——而是这三家公司已经不在做同一张考卷了

我们正在目睹一次文明级别的分岔:人类历史上最强大的三股技术力量,在同一个赛道上跑了两年之后,突然各奔东西。这不是产品策略的分歧。这是对"智能的瓶颈到底在哪"这个根本问题的三种截然不同的诊断。

"通用模型"的叙事正在碎裂。而碎裂本身,才是最重要的信号。

---

1. Anthropic:别跑分了,把工作流跑通

2月5日。Opus 4.6 发布。但标题不是模型本身——是 Agent Teams:在 Claude Code 内部编排的 AI 小队,能自动拆解任务、分配角色、协调执行。四种架构:Leader、Swarm、Pipeline、Watchdog。

模型层面的数据当然也有:ARC-AGI-2 从 37.6% 跃升至 68.8%,单代提升 31 个百分点——Opus 家族史上最大单次跳跃。百万级 token 上下文检索准确率 76.0%,同一测试 Gemini 3 Pro 只拿了 26.3%。

但纯编码能力(Terminal-Bench 2.0)是 65.4%,低于 GPT-5.3 Codex 的 77.3%。Anthropic 的优势不在代码生成速度——在于理解复杂的业务逻辑。

商业信号比跑分更响亮:Claude Code 六个月达到 10 亿美元 ARR,到二月翻倍突破 25 亿。公开 GitHub 提交中约 4% 来自 Claude Code。

Anthropic 的赌注:AI 商业化的瓶颈不是模型能力——是工作流编排。

这个判断背后有一个更深的洞察:能力已经溢出了。不是模型不够聪明,是没有人知道怎么把这种聪明组织起来、嵌入到真实的业务流程中去。

---

2. OpenAI:自研芯片,极致速度

2月12日。GPT-5.3 Codex Spark。OpenAI 第一个不跑在 Nvidia 硬件上的生产模型——完全部署在 Cerebras 晶圆级引擎上。推理速度 1,000+ tok/s,是传统 GPU 的 15 倍。

但速度有代价。Terminal-Bench 2.0:58.4%(完整版 Codex:77.3%)。上下文窗口缩至 128K。纯文本。

策略比产品重要。 背后是多年期的 Cerebras 合作(最高 750MW 算力),加上 AMD(6GW 协议)和 Broadcom(定制加速器)。整个行业正在从 Nvidia 单一文化走向芯片多元化。

OpenAI 的赌注:瓶颈不是推理深度——是延迟。

这是一个让人不太舒服的判断。它暗示的是:对于绝大多数用户来说,模型已经够聪明了,问题在于它回答得太慢、用起来太贵。如果推理速度提升一个数量级,AI 的使用场景会从"偶尔调用"变成"实时嵌入"——这才是真正的范式转移。

---

3. Google:别打代码战了,去解人类解不了的题

Google 在两周内打出了一记组合拳。2月12日:Deep Think 推理模式升级。2月19日:Gemini 3.1 Pro,把那种推理能力注入通用模型。

Deep Think 运行的是一种"System 2"架构——不是 token 级预测,而是暂停、评估多条逻辑路径、然后作答。ARC-AGI-2:84.6%,领先第二名 15.8 个百分点。

但昨天的 3.1 Pro 才是更大的棋步:把 Deep Think 的推理能力注入通用模型。16 项基准测试中 13 项领先。杀手级数据是价格:输入 $2 / 输出 $12 每百万 token——Opus 4.6 的七分之一

Google 的赌注:瓶颈不是工作流——是推理深度。而关键是把这种深度变成基础设施级的便宜。

这是三家公司中最像传统科技巨头的打法:高端品牌占领心智,低价通用产品占领市场。Deep Think 在上面,3.1 Pro 在下面。品牌拉高度,价格拉规模。

---

4. 三种诊断,不可能都对——但可能不止一种是对的

让我们把三个赌注并排放在一起:

- Anthropic 说:瓶颈是编排

- OpenAI 说:瓶颈是速度

- Google 说:瓶颈是推理深度

两年来,这三家公司在同一套基准测试上你追我赶。现在它们实质上放弃了正面比较。这不是偶然的差异化营销。每家公司对 AI 商业化的瓶颈做出了不同的诊断。

这件事本身就很值得玩味。它意味着"通用模型"的概念——一个模型在所有维度上都最强——正在从共识变成幻觉。

---

5. 芯片多元化:长期赌注,短期阵痛

Spark 证明了非 Nvidia 芯片可以提供极端的推理速度,但推理能力损失了 25%。真正的考验:Cerebras 能否在保持速度优势的同时缩小推理差距?

这里有一个更大的问题:过去十年,Nvidia 的 CUDA 生态系统是整个 AI 产业的公共基础设施。打破这种单一依赖,短期内必然带来碎片化的成本。但长期来看,任何健康的产业都不应该建立在单一供应商之上——这是工业史反复验证的铁律。

---

6. Agent 战争正式开打

Anthropic 的 Agent Teams。Google 3.1 Pro 在 APEX-Agents 上拿到 33.5%。OpenAI 同期推出的企业级 Agent 平台 Frontier。三家都在押注 Agent,但入口完全不同。

Agent 不是聊天机器人的升级版,而是工作方式的重新定义。它意味着 AI 不再是你去"使用"的工具,而是一个你"部署"的员工。这个转变的意义,远比任何一次跑分提升都要深远。

---

7. 分岔之后,你该怎么办?

你可能在想:三家公司,三条分岔路——我该押哪一条?

这个问题本身就问错了。

你不需要押注。你需要理解的是分岔本身意味着什么。

它意味着 AI 能力已经扩展到了这样一个地步:没有任何单一维度能产生绝对赢家。它意味着工具选择不再是"挑最强的"——而是"挑最适合你场景的"。

竞争性分岔意味着你身处买方市场。三家公司朝三个方向全力冲刺,最终的受益者是那个足够了解自己需求的人。

别试图跟上每一个模型。跟上你自己的工作流需求就够了。

我们在文章开头说,"通用模型"的叙事正在碎裂。但换一个角度看,碎裂未必是坏事。统一叙事的终结,恰恰是个体选择的开始。当所有人都挤在同一条路上时,你没有选择;当路分成三条时,你终于可以选那条属于你的。

Don't Panic. Accelerate.

上一篇
能力收敛 / 当代码写得一样好,战争才真正开始
下一篇
验证回路 / 用《银翼杀手2049》拆解智能时代的真正稀缺资源
全部信号