生成AI

Mythosの衝撃とGPT-6前夜——AIは新たな臨界点へ

Anthropicが危険すぎて公開できないと判断した超強力モデル「Claude Mythos」の詳細が明らかになり、OpenAIのGPT-6は市場の78%が4月末リリースを確信している。

1. AnthropicがClaude Mythos Previewを限定公開——サイバーセキュリティ能力が「危険すぎて」一般公開を見送り

Anthropicは4月7日、新世代モデル「Claude Mythos Preview」を約50の厳選パートナー組織のみに限定公開した。Mythos PreviewはSWE-bench Verifiedで93.9%を記録し、現トップモデルのClaude Opus 4.6(80.8%)を大幅に上回る。同社は「Claude Opus 4.6からの段階的改善ではなく、全く新しいモデルクラスへの飛躍」と表現している。

最大の理由はサイバーセキュリティ能力の異常な高さだ。Anthropicは内部テストでMythosにあらゆる主要OS・Webブラウザの解析をさせた結果、27年前から存在したOpenBSDの脆弱性(リモートからマシンをクラッシュさせられるもの)を含む「数千件のゼロデイ脆弱性」を自律的に発見したと報告した。これほどの攻撃能力を持つモデルを無制限に公開することはできないと判断、Project Glasswingと名付けた取り組みを通じて限定的に活用する。

Project Glasswingでは、選ばれたパートナーがMythosを使って世界中の重要インフラのソフトウェアに潜む脆弱性を事前に発見・修正する。Anthropicはパートナーに1億ドル以上の使用クレジットを付与する。「攻撃者よりも先にバグを見つけ、修正することがサイバーセキュリティの本質」という哲学のもと、守備的用途に特化した形でMythosの強力な能力を社会に還元するという、新しいモデルリリース戦略の形が示された。Amazon BedrockとGoogle Cloud Vertex AIでもゲーテッドプレビューとして利用可能になっている。


2. GPT-6(コードネーム”Spud”)——4月末リリースにPolymarket78%の確信、二層推論アーキテクチャの全貌

OpenAIはGPT-6(開発コードネーム「Spud」)のプレトレーニングを3月24日にテキサス州アビリーン・Stargateデータセンターで完了したことが複数の信頼性の高いAIリサーチャーにより確認されている。Sam Altmanは3月下旬に「数週間以内」のリリースと示唆しており、Polymarketのトレーダーは4月末までのリリースに78%の確率を与えている。

技術的には二層推論フレームワークが採用されている。System-1は高速な応答生成・コンテンツ作成(速い思考)、System-2は内部論理検証と多段階推論(遅い思考)を担い、両者を動的に切り替えることでハルシネーション率を0.1%未満に抑えると報告されている。価格はGPT-5.4と同水準で入力100万トークンあたり2.5ドル、出力12ドルとなる見通しだ。

一方でOpenAIは4月14日時点でアーキテクチャ論文・パラメータ数・学習データ開示・ベンチマーク・価格表・ローンチ日・確定モデル名のいずれも公式発表しておらず、4月14日リリースという特定の噂は未確認のままだ。予測市場は4月末までの確率を78%としつつも、5月前の確率は10%未満と見る向きもある。ChatGPT・Codex・Atlasブラウザを統合した「スーパーアプリ」を同時リリースするという情報もあるが、こちらも未確認だ。


3. Claude Managed Agentsが正式β公開——Notion・Rakuten・Sentryが採用、月額換算58ドルでフル自律エージェント

Anthropicは4月8日、「Claude Managed Agents」をパブリックβとしてリリースした。これはClaude APIの上に構築された、クラウドホスト型AIエージェントを本番運用するためのフルマネージドインフラだ。サンドボックス化されたコード実行、チェックポイント管理、クレデンシャル管理、スコープ付き権限、エンドツーエンドのトレーシングをすべて提供し、開発者はエージェントのロジック定義だけに集中できる。

料金は1セッション時間あたり0.08ドル(通常のClaudeトークン課金に追加)。24時間365日動かし続けた場合の月額は約58ドル。Notion・Rakuten・Sentryがすでに採用しており、Notionはドキュメント整理タスク、Sentryはエラートリアージの自動化、Rakutenはカスタマーサポートエージェントに活用していると報告されている。すべてのAPIエンドポイントにはmanaged-agents-2026-04-01ベータヘッダーが必要。

Anthropicのアプローチは競合他社と一線を画す。AWS Lambda的なステートレスな関数実行ではなく、長時間にわたって状態を保持・継続しながら動作する「真のエージェント」を想定したインフラ設計だ。The New Stackは「AnthropicはAIエージェントをあなたのために運用したい」と評した。Claude Codeが開発者向けコーディングエージェントとして市場を席巻(2月調査で46%の「最も愛用」、GitHubコミットの約4%を占める)した実績を受けて、Anthropicは次の戦場として「エンタープライズ向けフルマネージドエージェント」を明確に定義した。


4. Google ADK TypeScript版リリース——Python・Go・Javaに続き4言語体制でマルチエージェント開発を加速

GoogleはAgent Development Kit(ADK)のTypeScript版を正式リリースし、Python・Go・Javaに続く4言語目の公式サポートを実現した。ADKは2025年のGoogle Cloud NEXTで発表されたオープンソースのコードファーストAIエージェント開発フレームワークで、GitHub上でのスター数はすでに8,200件を超え、開発者コミュニティで急速に採用が進んでいる。

フレームワークの特徴は「コードファースト」哲学にある。エージェントのロジック・ツール・オーケストレーションをすべてコードとして定義することで、テスタビリティとバージョン管理を担保する。複数の専門化されたエージェントを階層的に組み合わせるマルチエージェントシステムを簡単に構築でき、Cloud RunやVertex AI Agent Engineへのデプロイも数コマンドで完了する。

重要な点はモデル非依存であることだ。Geminiとの統合が最適化されてはいるが、他のモデルプロバイダーとも互換性を持つ設計になっており、AnthropicのClaude・OpenAIのGPTとも連携可能。リリースサイクルは隔週で、4月13日時点の最新版がPyPIとnpmに公開されている。MicrosoftのAutoGen、LangChainのLangGraphと競合するポジションだが、GoogleのクラウドインフラとVertex AIとの深い統合が差別化要素となっている。


5. HumanX AIカンファレンスでClaudeが最注目——サードパーティツールへのアクセス制限も話題に

4月に開催されたHumanX AIカンファレンスにおいて、Claudeが全セッションを通じて最も言及されたAIチャットボットとなり、Anthropicは多くのパネルで絶賛された。調査会社の統計でもClaude Codeは開発者向けAIコーディングツールのトップ(「最も愛用」46%)であり、同社のエンタープライズ展開が着実に浸透していることを示している。

一方でAnthropicは4月初旬、サードパーティ開発者ツールがサブスクリプション認証情報でClaudeモデルにアクセスすることを遮断したことも明らかになった。OpenClawやOpenCodeなど非公式クライアントが対象で、公式APIを通じた正規アクセスへの誘導が意図された措置とみられる。開発者コミュニティでは反発も見られるが、セキュリティとサービス品質の担保のためとされている。

Claude Managed Agentsの正式β公開、Project Glasswingによるサイバー防衛、そしてアクセス制御の強化という一連の動きは、Anthropicがコンシューマー向けの「便利なAI」から、信頼性・セキュリティ・可監査性を重視するエンタープライズ・クリティカルインフラ向けAIプラットフォームへと軸足を移しつつあることを示唆している。