GPT-6迫る・Claude Opus 4.7公開・Gemini 3.1 Pro登場――AIモデル大競争の最前線

1. GPT-6リリース間近――2Mトークン・コーディング95%超のモンスターモデル

OpenAIが開発中のコードネーム「Spud」ことGPT-6が、4月30日以前にリリースされる確率78%とPolymarketが算出するほど秒読み段階に入った。3月24日にテキサス州アビリーンのStargateデータセンターで事前学習が完了し、後処理工程を経て最終調整中とされる。性能面では前世代のGPT-5.4比でコーディング・推論・エージェントタスク全体で40%以上向上し、HumanEvalスコアは95%超、数学推論（MATH）は約85%に達するという。最大の注目点は200万トークン（約150万ワード）のコンテキストウィンドウで、単一会話内での長大なドキュメント処理や超長期プロジェクト管理が現実的になる。Altman CEOは「メモリ・エージェント機能・マルチモーダル推論の強化」を最優先事項として挙げており、クロスセッション記憶機能によりAPIユーザーが手動でコンテキストを詰め込む手間がなくなる見通しだ。ただし公式ブログや製品ページはまだ存在せず、性能数値・価格・確定日はすべて未公認情報である点に注意が必要だ。

TokenMix Blogtokenmix.ai

2. Anthropic、Claude Opus 4.7を一般公開――ソフトウェアエンジニアリングと視覚処理を大幅強化

AnthropicがClaude Opus 4.7を正式にリリースした。主な改善点は複雑・長時間の実装タスクへの対応強化と、高解像度での視覚処理能力の向上だ。価格設定は入力$5.00・出力$25.00（100万トークンあたり）。Maxサブスクライバー向けにはオートモードが実装され、処理負荷に応じてOpus 4.7が自動選択されるようになった。また努力レベルに「xhigh」が追加され、従来の「high」と「max」の間に位置する新たな出力品質帯が設定された。一方で4月14日前後にはClaude Codeの応答品質低下に対するユーザーの反発が相次ぎ、Anthropicの製品責任者Boris Cherny氏は「デフォルト努力レベルをmediumに引き下げたことがユーザーフィードバックから判明した」と認め、トークン消費の抑制と品質維持のバランスという難しい課題が浮き彫りになった。

SiliconANGLEsiliconangle.com

3. Claude Codeに「ルーティン」機能とデスクトップ全面刷新――コーディングAIの自動化が加速

AnthropicがClaude Codeにルーティン機能を追加した。これはAnthropicのクラウドインフラ上でユーザーが定義した自動化タスクを繰り返し実行できるサービスで、CI/CDに近い感覚でAIコーディングを組み込める。さらにデスクトップアプリケーションが全面リデザインされ、統合ターミナル・高速Diffビューア・アプリ内ファイルエディタ・拡張プレビューエリアが新たに搭載された。加えてエージェントベースのコードレビュー機能も導入され、複数のAIレビュワーがPRの変更を並列分析する仕組みが実装されている（平均レビュー時間約20分）。またManaged Agentsサービスの立ち上げ（4月8日）により、エンタープライズがAIエージェントをスピーディに構築・展開できる基盤が整いつつある。Claude CodeはAnthropicの最も急成長している製品の一つとなっており、今後数カ月でさらなる機能追加が予告されている。

InfoQinfoq.com

4. Gemini 3.1 Pro登場――ARC-AGI-2で77.1%・リアルタイム音声と画像解析を統合

GoogleがGemini 3.1 Proを公開した。前世代のGemini 3 Proを複数のベンチマークで大幅に上回り、特にARC-AGI-2（まったく新しい論理パターンを解く能力を評価）で77.1%を達成したことが注目を集めている。テキスト・音声・画像・映像・コードリポジトリ全体を含む大規模マルチモーダル情報を統合的に処理できるほか、ツール使用とエージェンティックコーディングも改善された。Gemini 3.1 Flash TTS（テキスト音声変換）も同時期に更新され、表現力豊かで制御可能なAI音声の新基準として注目されている。またGoogleはAIコストを大幅削減できる圧縮アルゴリズムを発表しており、メモリ使用量を最大6分の1に削減できるという。提供はGemini API（AI Studio・Vertex AI）、NotebookLM、Gemini CLI、Android Studioなど幅広いプラットフォームで利用可能だ。

Google Blogblog.google

5. Anthropicがパートナー限定で「Claude Mythos Preview」を秘密公開――ゼロデイ脆弱性を数千件発見

Anthropicは4月7日、約50の厳選パートナー組織に限定してClaude Mythos Previewを公開した。「Project Glasswing」と呼ばれるこのプログラムの目的はサイバーセキュリティの脆弱性検出・高度推論・コーディングであり、「Claude Opus 4.6からの大きなステップアップ」と内部では説明されているという。非公開のベンチマーク結果ではSWE-bench Verifiedで93.9%、GPQA Diamondで94.6%を達成したとされ、さらに主要OSとブラウザ全体で数千件のゼロデイ脆弱性を発見したと報告されている。一般公開の時期は明らかにされていないが、サイバーセキュリティ専門組織への先行展開によって実世界での性能と安全性を精査する姿勢は、大規模言語モデルの責任ある展開を模索するAnthropicのアプローチを象徴している。

What LLM?whatllm.org

6. Amazonが16,000人のコーポレート人員削減――AI自動化への戦略的シフトが加速

Amazonが約16,000人のコーポレート従業員をレイオフすると発表した。同社はAI駆動の自動化への戦略的シフトを理由として挙げており、これは小売・物流・クラウドにまたがる大規模な業務再編の一環だ。Amazonの動きはテクノロジー業界全体で進むAI代替の象徴的事例として広く報道されており、GPT・ClaudeなどのLLMを業務プロセスに統合することで従来の人手作業をどこまで自動化できるかが問われ始めている。一方でスタンフォードのAI Index 2026によれば、AI採用速度はパソコンやインターネットの普及期を上回っており、ロボットの家庭内タスク成功率は依然わずか12%に留まるという「参加型知性」の凹凸も明らかにされている。業界全体での自動化推進とスキル転換の両立が、今後のAI展開における最大の社会的課題になりそうだ。

Radical Data Scienceradicaldatascience.wordpress.com