三条路线 / 统一叙事的终结
两周。三家公司。
两周。三家公司。四个模型。
你的信息流又炸了一次。评论区在尖叫"一切都变了"。但这一轮真正的信号,不是谁跑分更高——而是这三家公司已经不在做同一张考卷了。
我们正在目睹一次文明级别的分岔:人类历史上最强大的三股技术力量,在同一个赛道上跑了两年之后,突然各奔东西。这不是产品策略的分歧。这是对"智能的瓶颈到底在哪"这个根本问题的三种截然不同的诊断。
"通用模型"的叙事正在碎裂。而碎裂本身,才是最重要的信号。
---
1. Anthropic:别跑分了,把工作流跑通
2月5日。Opus 4.6 发布。但标题不是模型本身——是 Agent Teams:在 Claude Code 内部编排的 AI 小队,能自动拆解任务、分配角色、协调执行。四种架构:Leader、Swarm、Pipeline、Watchdog。
模型层面的数据当然也有:ARC-AGI-2 从 37.6% 跃升至 68.8%,单代提升 31 个百分点——Opus 家族史上最大单次跳跃。百万级 token 上下文检索准确率 76.0%,同一测试 Gemini 3 Pro 只拿了 26.3%。
但纯编码能力(Terminal-Bench 2.0)是 65.4%,低于 GPT-5.3 Codex 的 77.3%。Anthropic 的优势不在代码生成速度——在于理解复杂的业务逻辑。
商业信号比跑分更响亮:Claude Code 六个月达到 10 亿美元 ARR,到二月翻倍突破 25 亿。公开 GitHub 提交中约 4% 来自 Claude Code。
Anthropic 的赌注:AI 商业化的瓶颈不是模型能力——是工作流编排。
这个判断背后有一个更深的洞察:能力已经溢出了。不是模型不够聪明,是没有人知道怎么把这种聪明组织起来、嵌入到真实的业务流程中去。
---
2. OpenAI:自研芯片,极致速度
2月12日。GPT-5.3 Codex Spark。OpenAI 第一个不跑在 Nvidia 硬件上的生产模型——完全部署在 Cerebras 晶圆级引擎上。推理速度 1,000+ tok/s,是传统 GPU 的 15 倍。
但速度有代价。Terminal-Bench 2.0:58.4%(完整版 Codex:77.3%)。上下文窗口缩至 128K。纯文本。
策略比产品重要。 背后是多年期的 Cerebras 合作(最高 750MW 算力),加上 AMD(6GW 协议)和 Broadcom(定制加速器)。整个行业正在从 Nvidia 单一文化走向芯片多元化。
OpenAI 的赌注:瓶颈不是推理深度——是延迟。
这是一个让人不太舒服的判断。它暗示的是:对于绝大多数用户来说,模型已经够聪明了,问题在于它回答得太慢、用起来太贵。如果推理速度提升一个数量级,AI 的使用场景会从"偶尔调用"变成"实时嵌入"——这才是真正的范式转移。
---
3. Google:别打代码战了,去解人类解不了的题
Google 在两周内打出了一记组合拳。2月12日:Deep Think 推理模式升级。2月19日:Gemini 3.1 Pro,把那种推理能力注入通用模型。
Deep Think 运行的是一种"System 2"架构——不是 token 级预测,而是暂停、评估多条逻辑路径、然后作答。ARC-AGI-2:84.6%,领先第二名 15.8 个百分点。
但昨天的 3.1 Pro 才是更大的棋步:把 Deep Think 的推理能力注入通用模型。16 项基准测试中 13 项领先。杀手级数据是价格:输入 $2 / 输出 $12 每百万 token——Opus 4.6 的七分之一。
Google 的赌注:瓶颈不是工作流——是推理深度。而关键是把这种深度变成基础设施级的便宜。
这是三家公司中最像传统科技巨头的打法:高端品牌占领心智,低价通用产品占领市场。Deep Think 在上面,3.1 Pro 在下面。品牌拉高度,价格拉规模。
---
4. 三种诊断,不可能都对——但可能不止一种是对的
让我们把三个赌注并排放在一起:
- Anthropic 说:瓶颈是编排。
- OpenAI 说:瓶颈是速度。
- Google 说:瓶颈是推理深度。
两年来,这三家公司在同一套基准测试上你追我赶。现在它们实质上放弃了正面比较。这不是偶然的差异化营销。每家公司对 AI 商业化的瓶颈做出了不同的诊断。
这件事本身就很值得玩味。它意味着"通用模型"的概念——一个模型在所有维度上都最强——正在从共识变成幻觉。
---
5. 芯片多元化:长期赌注,短期阵痛
Spark 证明了非 Nvidia 芯片可以提供极端的推理速度,但推理能力损失了 25%。真正的考验:Cerebras 能否在保持速度优势的同时缩小推理差距?
这里有一个更大的问题:过去十年,Nvidia 的 CUDA 生态系统是整个 AI 产业的公共基础设施。打破这种单一依赖,短期内必然带来碎片化的成本。但长期来看,任何健康的产业都不应该建立在单一供应商之上——这是工业史反复验证的铁律。
---
6. Agent 战争正式开打
Anthropic 的 Agent Teams。Google 3.1 Pro 在 APEX-Agents 上拿到 33.5%。OpenAI 同期推出的企业级 Agent 平台 Frontier。三家都在押注 Agent,但入口完全不同。
Agent 不是聊天机器人的升级版,而是工作方式的重新定义。它意味着 AI 不再是你去"使用"的工具,而是一个你"部署"的员工。这个转变的意义,远比任何一次跑分提升都要深远。
---
7. 分岔之后,你该怎么办?
你可能在想:三家公司,三条分岔路——我该押哪一条?
这个问题本身就问错了。
你不需要押注。你需要理解的是分岔本身意味着什么。
它意味着 AI 能力已经扩展到了这样一个地步:没有任何单一维度能产生绝对赢家。它意味着工具选择不再是"挑最强的"——而是"挑最适合你场景的"。
竞争性分岔意味着你身处买方市场。三家公司朝三个方向全力冲刺,最终的受益者是那个足够了解自己需求的人。
别试图跟上每一个模型。跟上你自己的工作流需求就够了。
我们在文章开头说,"通用模型"的叙事正在碎裂。但换一个角度看,碎裂未必是坏事。统一叙事的终结,恰恰是个体选择的开始。当所有人都挤在同一条路上时,你没有选择;当路分成三条时,你终于可以选那条属于你的。
Don't Panic. Accelerate.