Claude Mythos・DeepSeek V4迫る、サイバーAI専用モデル競争激化

1. Anthropic「Claude Mythos」のベールが剥がれる——10兆パラメータの噂と限定公開

AnthropicはProject Glasswingと呼ばれる限定プログラムを通じて、約50のパートナー組織に対し「Claude Mythos Preview」のアクセスを提供していることが明らかになった。同社は公式コメントを控えているが、流出資料によると本モデルは「これまでに開発した中で群を抜いて最も強力なAIモデル」と位置付けられており、パラメータ数は10兆規模に達するとの報道もある。フォーカスはサイバーセキュリティの脆弱性検出、深層推論、コーディングの3領域で、Claude Opus 4.6から「段階的ではなく段差的（step change）な能力向上」と表現されている。

Anthropicは4月7日、同じくサイバー特化の「Claude Mythos Preview」を発表しており、これはGPT-5.4-Cyberより一週間早いリリースとなった。一方でAnthropicはMythosの一般公開時期を明かしておらず、高リスク用途への慎重なリリース戦略を維持している。現在LMSYS Chatbot ArenaのリーダーボードではOpus 4.6が首位に立っており、Mythosが公開された際の業界への影響は計り知れない。

Claude Code関連では、v2.1.69からv2.1.101へと約5週間で30回以上のリリースが行われ、NO_FLICKERレンダリングエンジン（v2.1.90）によりプロンプト描画サイクルが74%削減されるなどパフォーマンス改善が続いている。Linuxではv2.1.98からPIDネームスペース分離がチャイルドプロセスに適用され、セキュリティ面も強化された。

Fazm Blogfazm.ai

2. OpenAI vs Anthropic：サイバーAI専用モデルの競争——両社とも一般公開せず

OpenAIは4月14日に「GPT-5.4-Cyber」を発表し、Trusted Access for Cyber（TAC）プログラムを大規模に拡大した。このモデルはGPT-5.4のサイバー許可版であり、脆弱性の発見と修正に特化した設計になっている。これはAnthropicが4月7日にClaude Mythosを限定公開してから7日後のことであり、両社が同じ週にサイバー特化AIを打ち出すという異例の展開となった。

注目すべきは、両社ともこれらのモデルを一般公開しないという同じ判断を下した点だ。AIモデルの能力が高まるにつれ、攻撃的サイバー用途への転用リスクが安全保障上の懸念として急浮上しており、企業・政府向けの限定提供という形が当面のデファクトスタンダードとなりつつある。こうした動きは、AI規制の議論にも実質的な影響を与え始めている。

GPT-5 Turboも4月7日にリリースされており、テキスト・画像・音声を単一モデルで統合処理できるネイティブマルチモーダル能力が特徴だ。図表を見て修正版を生成するといった処理をAPIの一回呼び出しで完結でき、エンタープライズワークフローの簡素化に貢献している。OpenAIの年間換算売上は250億ドルを突破し、2026年後半のIPOに向けた準備が進んでいると報じられている。

Medium - Before The Curvemedium.com

3. DeepSeek V4、Huaweiチップで数週間以内に公開か——ロイターが確認

ロイターは4月3日、中国のAI研究所DeepSeekの新モデル「V4」が数週間以内に公開される見通しだと報じ、Huaweiの最新チップ「Ascend 950PR」上で動作することを確認した。公開は4月12日時点でまだ行われていないが、DeepSeek V4は同社にとって重要なマイルストーンとなる見込みで、西側の主要モデルと同等以上の性能を大幅に低いコストで提供するという同社の戦略を引き継ぐものだ。

同様のポジションにあるDeepSeek R2（推論モデル）はAIME 2025で92.7%、MATH-500で89.4%を達成し、OpenAIのo3に匹敵しながら価格は70%安いとされる。一方でDeepSeek R2はデータラベリングの遅延とチップ調達問題により発売が長期にわたって遅れており、創業者のLiang Wenfengが性能に満足していないことが原因だとも伝えられている。中国のAI開発がどこまで続くかという議論に、Huawei製チップという変数が加わっており、米国の輸出規制の実効性が改めて問われている。

フロンティアモデルの多様化という観点では、GLM-5.1がSWE-Bench Proで最優秀を主張し、Gemma 4の31Bモデルが自身の20倍規模のモデルを超えると報告されるなど、オープンソースと中国勢の存在感は増す一方だ。2026年Q1のAIベンチャー投資は2,672億ドルと前四半期比で2倍以上になっており、資金は引き続き集中している。

LLM Statsllm-stats.com

4. Meta Llama 4 Scout／Maverick——エッジとサーバーの両輪で開源戦略を加速

MetaはLlama 4ファミリーとして、Scout（17Bパラメータ・10Mトークンコンテキスト）とMaverick（17B活性パラメータ・128専門家MoE・1Mトークンコンテキスト）をオープンウェイトでリリースした。MaverickはGPT-4oとGemini 2.0 Flashを幅広いベンチマークで上回り、DeepSeek v3に匹敵する推論・コーディング性能を発揮している。Scout はコンシューマー向けGPU（VRAM 24GB）またはApple M4 Proで単体動作し、エッジ展開の選択肢が現実的に広がった。

同時にMetaは2兆パラメータの超大規模モデル「Llama 4 Behemoth」の開発も進行中と明かしており、オープンソース陣営が独自のフロンティア競争を展開しつつある構図が鮮明になった。MistralもLarge 3を投入し、構造化出力生成と関数呼び出しの精度を大幅に向上。EUデータ居住オプションをLa Plateformeで提供し、GDPR対応が必要なヨーロッパ企業から高い評価を受けている。

MCPはAnthropicが発案したにもかかわらず、OpenAI・Google・Microsoftが揃って採用し3月時点で累計インストール数が9,700万を突破した。エージェントが外部ツール・API・データソースへ接続するデファクトスタンダードとして機能し始めており、特定プロバイダーに縛られない中立的なエージェントインフラへの移行が加速している。Snapが新規コードの65%以上をAI生成体制に移行し1,000人規模の人員削減を発表するなど、AIが開発・運用現場を実質的に再編しつつある。

VentureBeatventurebeat.com

5. Claude Code、30リリースで変貌——エージェント管理クラウドとVisa決済連携も

Anthropicがmanaged agent cloudサービスをローンチし、Claude Codeのルーティン機能と連携させた形で、エージェントが24時間クラウドで自律稼働する基盤が整った。これに合わせてVisaが自律エージェント向けの決済レールを開放し、AIエージェントが人間の承認なしに料金が発生する取引を実行できるインフラが現実のものとなった。Microsoftは全10項目のOWASP Agentic Risksをカバーするガバナンスツールキット第一弾を公開し、急増するエージェント展開に対するセキュリティ指針の整備が始まっている。

Claude Code自体は新コマンドとして/powerup（機能チュートリアル）、/team-onboarding（クイックスタート自動生成）、/loop（定期実行）、/effort（推論深度制御）を追加した。Writeツールは差分計算が60%高速化し、起動時メモリが80MB削減、SSE伝送がO(n²)からO(n)に改善されている。これらの変更は単なるUX改善にとどまらず、大規模チームや複雑なリポジトリでの実運用を前提とした設計方針の転換を示している。

エージェントエコシステム全体では、GitHub ActionsのようなCI/CDとAIエージェントが融合し始めており、PRを起点に自動でコードレビュー・バグ修正・テスト実行をこなすパイプラインが標準的なワークフローとして定着しつつある。企業側での本格導入加速と、Anthropicの管理クラウドが組み合わさることで、2026年後半はエージェント活用が「実験フェーズ」から「本番フェーズ」へ転換する年になると見られている。

InfoQinfoq.com