生成AI

AIエージェント元年:Claude Managed AgentsとLlama 4が切り拓く新時代

Anthropicのエンタープライズ向けAIエージェント基盤が公開ベータへ、MetaはLlama 4 Scoutで1000万トークンの超長文脈処理を実現した。

1. AnthropicがClaude Managed Agentsを公開ベータ提供開始

2026年4月8日、AnthropicはエンタープライズAIエージェント向けのフルマネージド基盤サービス「Claude Managed Agents」を公開ベータとしてリリースした。開発者やIT部門がインフラを自ら構築・運用することなく、自律的なAIエージェントを即座に展開できる点が最大の特徴だ。料金はAPIのトークン料金に加え、セッション時間当たり0.08ドルが課金される。すでにNotion・楽天・Asanaといった大手テック企業が早期導入ユーザーとして参画しており、実業務での活用が始まっている。AIエージェントの普及において「エンジニアリング不要の自律型AI」という新しいカテゴリを確立する動きとして、業界から大きな注目を集めている。

2. MetaがLlama 4 Scoutをオープンソースで公開、1000万トークンのコンテキストを実現

Metaはオープンウェイトの視覚言語モデル「Llama 4 Scout」を公開した。同モデルは総パラメータ数1090億(アクティブ17B)のMixture-of-Experts構造を採用し、オープンウェイトモデルとして世界最大の1000万トークンのコンテキストウィンドウを持つ。これにより、コードベース全体や大量ドキュメントを一度に処理できる実用的な超長文脈推論が可能となった。消費者向けGPU(VRAM 24GB)やApple M4 Proでの動作を想定した設計で、研究者・開発者がローカル環境でも高性能マルチモーダル処理を試せる。テキスト・画像・動画フレーム・PDFを入力として扱え、エッジデバイスでのAI活用を大きく前進させる成果となっている。

3. DeepSeek V3.2がMITライセンスで公開、GPT-5.4の90%相当を低コストで実現

中国AI企業DeepSeekは、最新汎用モデル「DeepSeek V3.2」をMITライセンスのオープンソースとして公開した。総パラメータ数6710億・アクティブ370億のMoEアーキテクチャを採用し、MMLU(多言語理解)ベンチマークで94.2%という高スコアを記録、GPT-4oに匹敵する性能を示した。最大の強みは価格競争力で、同等性能の西側モデルと比較して70%以上低いコスト設定(100万トークン0.28ドル)が可能となっている。完全なオープンウェイトであることから商用・研究用途の幅が広く、グローバルなAI民主化を加速させる存在として注目を集めている。オープンソース界では現時点でのベスト汎用LLMとの評価も出ている。

4. AlibabaのAI動画生成モデル「HappyHorse-1.0」が正体判明

正体不明のAI動画生成モデル「HappyHorse-1.0」が、Artificial Analysisのブラインドテストランキングでテキスト→動画・画像→動画の両部門で首位を獲得し話題となっていたが、中国テック大手AlibabaのATH AI Innovation Unitによるプロジェクトであることが明らかになった。公開ベンチマークで既存の商用モデルを上回るスコアをたたき出したことで、AI動画生成競争における中国勢の実力を改めて示す結果となった。モデルはまだ開発段階にあるとされており、今後の正式リリースに向けた動向が注目される。Sora(早期閉鎖)以降、AI動画生成市場はAlibaba・ByteDance・xAIなど多極化が進んでいる。

5. AnthropicのClaude Mythosが大手OSとブラウザで数千件のゼロデイ脆弱性を発見

Anthropicは新たなセキュリティイニシアチブ「Project Glasswing」を発表し、次世代フロンティアモデル「Claude Mythos」のプレビュー版をサイバーセキュリティ用途に活用することを明らかにした。Claude Mythosプレビューは、主要なオペレーティングシステムおよびウェブブラウザにわたって数千件の高深刻度ゼロデイ脆弱性をすでに自律的に発見している。従来は熟練セキュリティエンジニアが数週間かけて行っていた脆弱性探索を、AIが大規模・高速に実施できることを実証するものだ。AIによるオフェンシブセキュリティ能力の急速な向上は、脆弱性開示プロセスや業界全体のセキュリティ基準に大きな変革をもたらすと見られている。

6. Mistral Large 3リリース—構造化出力・関数呼び出しを大幅強化

Mistral AIは「Mistral Large 3」を公開した。今回のアップデートでは構造化出力生成・関数呼び出しの精度・JSONモードの信頼性が大幅に向上している。また、EU域内でのデータレジデンシーをLa Plaforme経由で提供するなど、欧州企業向けのデータ主権対応も強化された点が注目される。同時に多言語セマンティック検索性能を改善した「Mistral Embeddings v2」も発表され、エンタープライズ向けのRAGパイプラインや検索システムへの応用が期待される。欧州発AIとして規制対応と性能向上を両立させる戦略を継続している。

7. Googleが「Gemini 3.1 Pro」をVertex AIで一般提供開始

GoogleはGemini 3.1 ProをVertex AI上で正式に一般提供(GA)開始した。最大200万トークンのコンテキストウィンドウをエンタープライズ向け本番環境で利用可能となり、ドキュメントレベルのキャッシング機能やGoogle検索を用いた改善されたグラウンディング機能も新たに追加された。大規模ドキュメント処理・コード解析・マルチモーダルタスクを必要とするエンタープライズワークロードに向け、Google CloudのAI戦略の中核をなす存在として位置づけられている。競合するClaude Opus 4.6がLMSYS Chatbot Arenaで首位を維持する中、Geminiファミリーも急速な進化を遂げている。