戻るDON'T PANIC
2026.02.2010 min

三つのルート / 統一ナラティブの終焉

2週間。3社。

2週間。3社。4つのモデル。

あなたのタイムラインがまた爆発した。リプライ欄は「すべてが変わった」と叫んでいる。だが今回の本当のシグナルは、誰のスコアが高かったかではない——この3社がもはや同じ試験を受けていないということだ。

私たちは文明レベルの分岐を目撃している。人類史上最も強力な3つのテクノロジー勢力が、2年間同じトラックを走り続けた末に、突然それぞれ別の方向へ舵を切った。これはプロダクト戦略の相違ではない。「知能のボトルネックは一体どこにあるのか」という根本的な問いに対する、3つの全く異なる診断だ。

「ユニバーサルモデル」のナラティブが砕けつつある。そして、砕けること自体が最も重要なシグナルだ。

---

1. Anthropic:ベンチマークは飛ばせ、ワークフローを回せ

2月5日。Opus 4.6発表。だが見出しはモデルそのものではない——Agent Teamsだ。Claude Code内部で編成されるAIチームが、タスクを自動分解し、役割を割り当て、実行を調整する。4つのアーキテクチャ:Leader、Swarm、Pipeline、Watchdog。

モデル層のデータも当然ある。ARC-AGI-2は37.6%から68.8%へ跳躍、単世代で31ポイントの向上——Opusファミリー史上最大のジャンプ。100万トークンのコンテキスト検索精度は76.0%、同テストでGemini 3 Proは26.3%。

だが純粋なコーディング能力(Terminal-Bench 2.0)は65.4%で、GPT-5.3 Codexの77.3%を下回った。Anthropicの優位性はコード生成速度にはない——複雑なビジネスロジックの理解にある。

ビジネスシグナルはベンチマークより雄弁だ。Claude Codeは6ヶ月で10億ドルARRに到達し、2月には25億ドルを突破。公開GitHubコミットの約4%がClaude Code由来だ。

Anthropicの賭け:AI商業化のボトルネックはモデル能力ではない——ワークフローのオーケストレーションだ。

この判断の背後にはより深い洞察がある。能力はすでにオーバーフローしている。モデルが十分に賢くないのではなく、その賢さをどう組織化し、実際のビジネスプロセスに埋め込むかを、誰も知らないのだ。

---

2. OpenAI:カスタムシリコン、極限の速度

2月12日。GPT-5.3 Codex Spark。OpenAI初のNvidiaハードウェアを使わない本番モデル——Cerebrasウェーハスケールエンジンに完全デプロイ。推論速度1,000+ tok/s、従来GPUの15倍。

だが速度には代償がある。Terminal-Bench 2.0:58.4%(フル版Codex:77.3%)。コンテキストウィンドウは128Kに縮小。テキストのみ。

戦略はプロダクトより重要だ。 背後には複数年のCerebras契約(最大750MW計算能力)、AMD(6GW契約)、Broadcom(カスタムアクセラレータ)がある。業界全体がNvidiaモノカルチャーからチップの多様化へと動いている。

OpenAIの賭け:ボトルネックは推論の深さではない——レイテンシーだ。

これは少し居心地の悪い判断だ。大多数のユーザーにとってモデルはすでに十分に賢く、問題は応答が遅すぎ、コストが高すぎることだ——と暗に示している。推論速度が一桁上がれば、AIの利用シーンは「たまに呼び出す」から「リアルタイムで組み込む」に変わる。それこそが本当のパラダイムシフトだ。

---

3. Google:コード戦争は忘れろ、人間には解けない問題を解け

Googleは2週間でワンツーパンチを繰り出した。2月12日:Deep Think推論モード強化。2月19日:Gemini 3.1 Pro、その推論力を汎用モデルに注入。

Deep Thinkは「System 2」アーキテクチャで動く——トークンレベルの予測ではなく、一度立ち止まり、複数の論理パスを評価し、答える。ARC-AGI-2:84.6%、2位に15.8ポイント差。

だが昨日の3.1 Proこそが、より大きな一手だ。Deep Thinkの推論を汎用モデルに注入。16のベンチマーク中13で首位。決定的な数字は価格:入力$2 / 出力$12(100万トークンあたり)——Opus 4.6の7分の1

Googleの賭け:ボトルネックはワークフローではない——推論の深さだ。そしてその深さをインフラレベルで安くすることが勝負手だ。

3社の中で最もクラシックな大手テック企業の打ち方だ。ハイエンドブランドで心理を掴み、低価格の汎用プロダクトで市場を掴む。Deep Thinkが上、3.1 Proが下。ブランドで高度を稼ぎ、価格でスケールを取る。

---

4. 三つの診断——すべてが正しいはずはないが、一つだけとも限らない

3つの賭けを並べてみよう:

- Anthropicは言う:ボトルネックはオーケストレーション

- OpenAIは言う:ボトルネックは速度

- Googleは言う:ボトルネックは推論の深さ

2年間、この3社は同じベンチマークセットで追いかけ合いをしてきた。今やそれぞれが正面比較を事実上放棄した。偶然のポジショニングではない。各社がAI商業化のボトルネックに対して異なる診断を下したのだ。

これだけでも考える価値がある。「ユニバーサルモデル」——あらゆる次元で最強の単一モデル——という概念が、コンセンサスから幻想へと変わりつつあることを意味している。

---

5. チップの多様化:長期の賭け、短期の痛み

SparkはNvidia以外のシリコンで極端な推論速度を実現できることを証明したが、推論能力は25%低下した。真の試練:Cerebrasは速度優位を維持しながら推論ギャップを埋められるか?

より大きな問いがある。過去10年、NvidiaのCUDAエコシステムはAI産業全体の共有インフラだった。その単一依存を断つことは、短期的には必然的にフラグメンテーションのコストを生む。だが長期的に見れば、健全な産業は単一サプライヤーの上に成り立つべきではない——これは産業史が繰り返し検証してきた鉄則だ。

---

6. エージェント戦争、本格開戦

AnthropicのAgent Teams。Google 3.1 ProがAPEX-Agentsで33.5%。OpenAIの同時期のエンタープライズAgentプラットフォームFrontier。3社ともエージェントに賭けているが、入口がまったく違う。

エージェントはチャットボットのアップグレード版ではない——仕事のあり方の再定義だ。AIはもはや「使う」ツールではなく、「配置する」従業員になる。この転換の意味は、いかなる単発のベンチマーク向上よりも遥かに深い。

---

7. 分岐の先で、あなたは何をすべきか?

こう考えているかもしれない。3社、3つの分岐路——どれに賭ければいいのか?

その問い自体が間違っている。

賭ける必要はない。分岐そのものが何を意味するかを理解すればいい。

それは、AI能力が拡大しすぎて、もはや単一の次元で絶対的な勝者が生まれないことを意味する。ツール選びは「最強を選ぶ」から「自分のユースケースに最適なものを選ぶ」に変わったということだ。

競争的分岐は、あなたがバイヤーズマーケットにいることを意味する。3社が3方向に全力疾走し、最終的な受益者は自分のニーズを十分に理解して正しいツールを選べる人間だ。

すべてのモデルについていこうとするな。自分のワークフローの要求についていけ。それで十分だ。

冒頭で「ユニバーサルモデル」のナラティブが砕けつつあると書いた。だが別の角度から見れば、砕けることは必ずしも悪いニュースではない。統一ナラティブの終焉は、まさに個人の選択の始まりだ。全員が一本の道に押し込まれているとき、選択肢はない。道が三つに分かれたとき、ようやく自分のものを選べるようになる。

Don't Panic. Accelerate.

前の記事
能力収束 / すべてのコードが完璧になったとき、本当の戦争が始まる
次の記事
検証ループ / 『ブレードランナー2049』で解体する知能時代の唯一の希少資源
全シグナル