GPT-5.5とGoogle4兆円投資でAI業界の地殻変動が加速

1. OpenAI、GPT-5.5を正式リリース——推論・自律性でOpus 4.7を上回ると主張

OpenAIは2026年4月24日、最新フラッグシップモデル「GPT-5.5」と「GPT-5.5 Pro」をAPIおよびChatGPTで一般公開した。同社はGPT-5.5を「これまでで最もスマートかつ直感的なモデル」と位置づけており、特にユーザーの目標を素早く把握する能力と、コーディング・調査・データ分析・ドキュメント作成・ソフトウェア操作などのタスクに強みがあるとしている。内部テストに参加したシニアエンジニアからは「推論と自律性においてGPT-5.4やClaude Opus 4.7を明確に上回る」という評価が出ており、エージェントワークフロー向けの性能が際立つという。一方でAPIの料金体系はGPT-5.4と同水準に据え置かれており、コスト競争力を維持しつつ性能向上を実現したとアピールしている。今月はAgentic AIの主要プレイヤー3社が同日に自律エージェントツールを発表するという異例の展開もあり、業界の競争が一段と激化していることを示している。今後数週間でのベンチマーク詳細開示が注目される。

OpenAIopenai.com

2. GoogleがAnthropicに最大4兆円超の投資を決定——Anthropic ARRは1年で30倍の3兆円超に

GoogleはAnthropicへの追加投資として最大400億ドル（約6兆円）を約束し、うち100億ドルを即時送金したと報じられた。さらにGoogle Cloudは2027年から5年間で5GWの計算リソースをAnthropicに提供することを約束しており、単なる財務投資にとどまらず、インフラ面でも深いパートナーシップを形成する形となった。この投資はAIの「ビッグスリー時代」の終わりとも評されており、OpenAIを含む競合への圧力として機能する可能性がある。Anthropicの年間経常収益（ARR）は2026年3月に300億ドルを超え、2025年初頭の約10億ドルから1年で約30倍に急増したという驚異的な成長を見せている。Claude Codeの急速な普及がエンタープライズ採用を牽引しており、コーディングエージェント市場でのAnthropicの存在感が売上に直結している構図だ。AIインフラ争奪戦はコンピュート確保が最大の競争軸になりつつあり、大規模な計算リソースを押さえた企業が優位に立つ「コンピュート覇権」時代の幕開けを象徴するニュースと言える。

36Kr36kr.com

3. Claude Codeが5週間で30回以上リリース——Agent-Based PR Reviewを導入しAIコーディング市場を席巻

InfoQの報道によれば、AnthropicはClaude Codeに「エージェントベースのプルリクエストレビュー」機能を新たに導入した。複数のAIレビュアーがコード変更を並列に分析し、人間のコードレビューを補完・代替するシステムで、大規模コードベースへの対応力が従来の単一モデルレビューと比較して大幅に向上しているという。2026年4月は、Claude CodeのAgent SDKが13日間で4つのマイナーバージョンをリリースし、5週間での総リリース数が30回を超えるという異例のペースで開発が進んでいる。特にClaude CoworkのmacOS・Windowsへの一般公開、Managed Agentsのパブリックベータ開始が大きなマイルストーンとして注目されている。先週明らかになった品質低下問題のポストモーテム公開とその修正対応を経て、Anthropicは透明性向上にも取り組んでいる。AI駆動のコーディングエージェント市場において、Claude Codeの機能拡張スピードは競合のGitHub CopilotやCursorを大きく上回るペースで進んでおり、エンタープライズでの採用加速が続く見通しだ。

InfoQinfoq.com

4. Google DeepMind、Deep Research MaxとAletheia数学AIを相次いで発表

Google DeepMindは4月21〜24日にかけて、自律型研究エージェントの刷新と数学特化AIの2つの重要な発表を行った。「Deep Research Max」はGemini 3.1 Proをベースとしたエージェントで、テスト時間計算を延長することで反復的な推論・検索・精査を繰り返してから最終回答を出力する設計になっており、MCP（Model Context Protocol）経由でサードパーティデータソースとの接続にも対応。企業の独自データと公開Web情報を同一APIコールで融合できる点が画期的だ。一方「Aletheia」は自律的な数学研究を行うAIで、Gemini 3 Deep Thinkを活用してFirstProofチャレンジの10問中6問を解決し、IMO-ProofBenchで約91.9%のスコアを達成した。人間の数学者が関与せずにIMOレベルの証明問題を自律的に解くという能力は、AIの科学的発見への応用可能性を大きく押し広げるものとして研究コミュニティから高い関心を集めている。さらに「Decoupled DiLoCo」という分散学習手法も同時発表され、データセンター間の非同期学習を可能にする新技術の概要が公開された。

Google DeepMinddeepmind.google

5. Stanford AI Index 2026——SWE-bench近100%到達、透明性スコアは過去最低水準に低下

Stanfordの人間中心AI研究所（HAI）が毎年発行するAI Indexの2026年版が公開され、急速な技術的進歩と同時に深刻な懸念も浮き彫りになった。コーディングベンチマークのSWE-bench Verifiedは1年間で60%から100%近くに達し、AI能力の指数的な向上が示された。Anthropic Claude Opus 4.6とGoogle Gemini 3.1 Proが最も難しい「Humanity’s Last Exam」で50%超を達成するなど、複数の指標でAIは人間の専門家水準を超えつつある。一方で懸念されるのは透明性の急落で、Foundation Model Transparency Indexの平均スコアが昨年の58点から40点へと大幅に低下しており、モデルが高性能化するほど開発情報の開示が少なくなるという逆説的な傾向が明らかになった。環境負荷も深刻化しており、Grok 4の学習推定排出量は7万2816トンのCO2換算で、自動車1万7000台を1年間運転した量に相当するという。米国の民間AI投資は2025年に2859億ドルに達し、中国の23倍以上となっており、AI覇権をめぐる地政学的競争が経済規模でも鮮明になっている。

Stanford HAIhai.stanford.edu

6. DeepSeek R2が推論ベンチマークで最高水準——AIME 2025で92.7%、o3に肉薄

中国のDeepSeekが最新推論モデル「DeepSeek R2」を公開し、AIME 2025ベンチマークで92.7%、MATH-500で89.4%を達成したと報告した。これらの数値はOpenAIのo3モデルに匹敵するとされており、世界最高水準の推論モデルに中国発のオープンウェイトモデルが並ぶという状況が改めて示された。Stanford AI Index 2026では「米中のモデルは2025年初頭から複数回リードを入れ替えており、2026年3月時点でAnthropicのトップモデルが2.7%差でリードしている」と記録されており、競争の拮抗ぶりが浮き彫りになっている。DeepSeek R2はオープンウェイトとして公開される予定で、コスト効率の高い中国のAI開発アプローチが改めて注目を集めている。これに対しOpenAIやAnthropicなどの米国企業は輸出規制や計算リソースの囲い込みで対抗する姿勢を見せているが、オープンウェイトモデルの普及が規制の実効性を下げるという構造的な問題も指摘されている。AI安全性と技術覇権の両立という難しい課題が、国際社会での議論を加速させることは必至だ。

Fazm Blogfazm.ai

7. MIT Tech Review「ポストLLM時代が始まった」——世界モデルがAIの次のフロンティアに

MIT Technology Reviewは「LLMs+: 10 Things That Matter in AI Right Now」と題した特集記事を公開し、大規模言語モデルを超えた次世代AI技術「ワールドモデル」の台頭を特集した。ワールドモデルは視覚的・物理的データを組み込んでリアルワールド環境をシミュレートできる新しい種類のAIモデルで、LLMが苦手とする物理的推論や長期計画を克服できる可能性があるとされる。同誌は今月のGPT-5.5、Gemma 4、DeepSeek V4、Gemini 3.1など多数のリリースを「エージェントワークフロー中心」という共通軸で整理しており、モデル性能の単純競争から「どのようにエージェントとして機能するか」への評価軸のシフトを指摘している。LLMの技術的限界が実用上の問題として表面化してきたことで、神経科学的なアーキテクチャや強化学習との組み合わせによる「ポストトランスフォーマー」研究が再注目されている。AI産業が一世代前の技術に最大規模の投資を続ける中、次のブレイクスルーの方向性をめぐる議論はアカデミアとインダストリーの間で活発化している。

MIT Technology Reviewtechnologyreview.com