Claude CodeルーティンからGemma 4まで——AIエコシステムが一斉加速

1. Claude Code「Routines」登場——夜中にコードが自分で動く時代へ

Anthropicは2026年4月14日、Claude Codeの大型アップデートとして自律実行機能「Routines（ルーティン）」をリサーチプレビューとして公開した。Routinesとは、プロンプト・リポジトリ・コネクター（Slack、Linear、Google Drive、GitHub）・トリガーを一括設定し、スケジュールまたはWebhookを起点に自動実行される保存済みワークフローである。GitHubのプルリクエスト・プッシュ・Issue・Check Runなど8種類のWebhookイベントをトリガーとして利用でき、実行中は手動承認なしにAnthropicの管理サーバー上で完結する。利用枠はProが1日5回、Maxが15回、TeamとEnterpriseが25回で、超過分は従量課金となる。ベータユーザーのレポートでは「深夜にバグ修正PRを自動生成し、翌朝にはCIがパス済みだった」といった事例が報告されており、開発者の非同期ワークフローを根本から変える可能性を示している。デスクトップアプリのUIも同時にリニューアルされ、プロジェクト管理とルーティン管理が統合された新しいダッシュボードが提供された。

9to5Mac9to5mac.com

2. Google「Gemma 4」正式公開——31BモデルがApache 2.0で無償配布

Googleは4月2日、オープンウェイトモデルファミリー「Gemma 4」を発表した。ラインナップはE2B・E4B・26B MoE・31B Denseの4種類で、スマートフォンからコンシューマーGPUまで幅広いデバイスをターゲットとしている。最大の特徴はGemma世代初のApache 2.0ライセンス採用で、商用利用が完全に自由化された。コンテキストウィンドウは最大256K、ネイティブな画像・音声処理に対応し、140以上の言語をサポートする。ベンチマークでは31BモデルがGemma 3の400B相当のスコアを記録、「パラメータあたりの性能」では現時点の公開モデル最高水準とされている。Gemini 3と同一の研究・技術基盤で構築されており、エージェント型ワークフローと高度な推論を念頭に設計されている。Gemma初代からの累計ダウンロード数は4億回を超え、派生モデル（Gemmaverse）は10万種類以上に達している。

Google Blogblog.google

3. Meta「Llama 4 Scout & Maverick」——MoEとネイティブマルチモーダルで世界最長コンテキスト

Metaは4月5日、Llamaファミリー史上最大のアーキテクチャ刷新となる「Llama 4 Scout」と「Llama 4 Maverick」を公開した。両モデルはLlamaシリーズ初のMixture-of-Experts（MoE）アーキテクチャを採用し、視覚・言語を分離せずに統合する「アーリーフュージョン」によるネイティブマルチモーダル設計を実現している。ScoutはパラメータをアクティブにするExpertを16基持つ17Bモデルで、約40兆トークンのマルチモーダルデータで事前学習された。業界最長クラスのコンテキストウィンドウ1000万トークン（10M）をサポートし、Gemma 3・Gemini 2.0 Flash-Lite・Mistral 3.1を主要ベンチマークで上回ると発表された。VRAM 24GBの一枚のコンシューマーGPUで全速動作するため、ローカル実行の選択肢として研究者・開発者双方から注目されている。HuggingFaceとllama.comからオープンウェイトとして入手可能。

Meta AI Blogai.meta.com

4. DeepSeek R2——32Bオープンウェイトでフロンティア推論コストを7割削減

中国のAIラボDeepSeekが公開した「R2」は、32BパラメータのDenseトランスフォーマーでMITライセンスという構成で、業界に再び衝撃を与えた。AIME 2025で92.7%、MATH-500で89.4%を記録し、単一のRTX 4090またはA6000で完全動作する。コスト面では、欧米のフロンティア推論APIと比較してトークンあたり約70%安価と試算されており、スタートアップや研究者の経済的な障壁を大幅に下げる。技術的にはR1で導入したGRPO強化学習パイプラインを精錬した独自のポストトレーニングに重点を置いており、「スケールより質」の方針が明確だ。当初は2025年5月リリースが予定されていたが、梁文鋒CEOがパフォーマンスに納得いかずリリースを1年近く先延ばしにしていた経緯がある。

Decode the Futuredecodethefuture.org

5. Claude Opus 4.6がChatbot Arenaで首位——SWE-benchmark 65.3%の衝撃

AnthropicのClaude Opus 4.6が、LMSYS Chatbot Arenaの人間評価でGPT-5.4とGemini 3.1 Proを抑え首位に立った。特に注目されるのはSWE-bench Verified（実際のGitHub Issueを自動解決する難易度の高いベンチマーク）での65.3%という過去最高スコアで、ソフトウェアエンジニアリング能力の飛躍的な向上を示している。Anthropicは現在、年換算収益が190億ドルに迫っており、競合OpenAIの250億ドルに追随する勢いだ。同社の急成長はBroadcomとGoogleのインフラ事業にも直接貢献しており、AIクラウドの受益者として両社が注目を集めている。

LLM Statsllm-stats.com

6. OpenAI・Anthropic・Google——中国によるモデル模倣阻止で異例の連携

ライバル関係にあるOpenAI・Anthropic・Alphabetの3社が、中国の競合他社による最先端AIモデルからの結果抽出・模倣を取り締まる目的で情報共有を開始した。3社はMicrosoftも含む4社が2023年に設立した業界非営利団体「Frontier Model Forum」を通じて協力している。知的財産の流出という共通課題が競合関係を超えた連携を生んだ構図であり、今後の国際的なAIガバナンス形成に影響を与える動きとして注目される。一方でOpenAIは年換算収益250億ドル超を達成し、2026年後半にもIPOに向けた初期準備を進めているとも報じられている。

Bloombergbloomberg.com

7. Gemini Robotics-ER 1.6——Boston Dynamicsとの協業で産業認識能力を強化

Google DeepMindは「Gemini Robotics-ER 1.6」をリリースし、Boston Dynamicsとの共同開発による新たな産業知覚機能を追加した。工場・倉庫などの産業環境で求められる精密な物体認識・把持計画・環境適応能力が大幅に向上しており、実用ロボットとのインテグレーションが加速している。Gemini 3.1もVertex AI上でエンタープライズ向け正式提供が開始され、2Mトークンのコンテキスト・ドキュメントキャッシュ・1fpsのネイティブ動画理解が本番ワークロードで利用可能になった。

jls’s blogjls42.org