生成AI

Claude Opus 4.7 GA、GPT-5.5 Instant、DeepMind AlphaEvolve:AI競争がさらに激化

Anthropic・OpenAI・GoogleDeepMindが相次いで大型アップデートを発表し、AIエージェント時代の本格化を告げる1日となった。

1. Claude Opus 4.7 正式リリース&AnthropicがSpaceXと提携してClaude Codeのレート制限を倍増

Anthropicは最新モデル「Claude Opus 4.7」を正式リリースした。ソフトウェアエンジニアリングや複雑なコーディングタスクにおける性能が向上し、高解像度画像を処理できるビジョン能力も強化されている。従来モデルと比べ、長時間の自律的なコーディング作業においても精度と一貫性が高まっているのが特徴だ。

また、AnthropicはSpaceXのColossus 1データセンターの全コンピューティング容量を利用する契約を締結した。この提携により300メガワット以上の新規キャパシティを「1ヶ月以内」に追加できるとしており、さらに「数ギガワット規模の軌道上AIコンピュートキャパシティの開発パートナーシップに関心がある」とも表明した。実質的な恩恵としてClaude Codeの有料ユーザー(Pro・Max・Enterprise)の5時間制限が倍増され、レート制限も緩和された。

Claude Code自体も大規模アップデートが行われ、よりスマートなモデル選択機能、プロジェクト削除ツール、強化されたパーミッション管理、改善されたOAuthログイン、Windows・PowerShellの修正、テレメトリーの改善、UIとセキュリティの安定性向上など、多岐にわたる改善が実施された。なお同社は新製品「Claude Design」もリリースしており、これはデザイン・プロトタイプ・スライド・ワンページャーなどのビジュアル成果物をClaudeと共同制作できるAnthropicLabsの新機能だ。

Engadgetengadget.com

2. OpenAI、GPT-5.5 InstantをChatGPTのデフォルトモデルに採用

OpenAIは2026年5月5日、「GPT-5.5 Instant」をリリースし、ChatGPTのデフォルトモデルとして採用した。より賢く、より正確な回答を提供し、幻覚(ハルシネーション)の削減とパーソナライズ制御の改善を実現している。さらに過去の会話・ファイル・Gmailを参照してパーソナライズされた回答を生成できる機能がPlus・Proユーザー向けに提供されている。

先立って4月23日にリリースされた「GPT-5.5」は、エージェント的なコーディング、コンピューター操作、ナレッジワークにおける大幅な進化を遂げており、複雑な複数ステップのリクエストを完成した成果物に変換する能力が向上した。複雑なターミナルワークフロー、実際のGitHubイシュー解決、長期間にわたるコーディングタスクにおいてより良いパフォーマンスを発揮するとしており、GPT-5.5はPlus・Pro・Business・Enterprise利用者のChatGPTおよびCodexで順次展開されている。

アジェンティックコーディング機能の強化により、複雑な目標を理解し、ツールを使用し、成果物を検証しながらタスクを完遂する能力が高まった。2026年のAIコーディングエージェント市場では、GPT-5.5によるOpenAI Codexが最高水準のコーディングエージェントワークフローとして評価されており、Claude Code(Opus 4.7)・Gemini CLI・Cursorと並ぶ主要プレイヤーとして位置づけられている。

TechCrunchtechcrunch.com

3. Google DeepMind、AlphaEvolveを発表:Gemini LLMで未解決アルゴリズム問題を自律発見

Google DeepMindが2026年5月に発表した「AlphaEvolve」は、Gemini LLMを活用して未解決問題の新アルゴリズムを発見するシステムだ。LLMとアルゴリズムの提案を評価・選択し、より良いものをLLMにフィードバックする進化的アルゴリズムを組み合わせた革新的なアーキテクチャを採用している。DeepMindは実際にAlphaEvolveを使用してデータセンターの電力消費管理やGoogleのTPUチップの効率化に関する新手法を発見した。

同社はまた4月に「Aletheia」を発表しており、Gemini 3 Deep Thinkを使用した数学自動証明AIとして、FirstProofチャレンジで10問中6問の新規数学問題を解き、IMO-ProofBenchで約91.9%のスコアを達成した。これはリサーチレベルの自動証明発見における大きな転換点を示すものだ。4月にはGemini Robotics ER-1.6もリリースされ、ロボティクス基盤モデルの更新も続いている。

AIモデルのベンチマーク性能という面では、Humanity’s Last Examにおいて現在のベストモデル(Anthropic Claude Opus 4.6やGoogle Gemini 3.1 Proなど)が50%を超えるスコアを記録しており、AIが人類最難関問題の半数以上を解ける段階に到達したことを示している。これはAI研究の進化の速さと、既存ベンチマークが急速に飽和しつつある現状を象徴する数字だ。

InfoQinfoq.com

4. Cloudflare、LLM推論インフラを大幅強化:Unweightで重みを最大22%圧縮

Cloudflareはグローバルネットワーク全体でLLMを実行するための新インフラを発表した。カスタム推論エンジンによってGPUをより効率的に管理し、入力処理と出力生成を最適化された異なるシステムに分離するアーキテクチャを採用している。これにより大規模なモデル推論のスループットと遅延を大幅に改善できるとしている。

さらに「Unweight」という重み圧縮システムも導入した。これはLLMの重みを精度の損失なしに15〜22%圧縮するもので、モデル配信コストの削減とエッジ推論の実用性向上を目指している。エッジコンピューティングにおけるAI推論の民主化を加速させる可能性がある技術として注目されている。

Cloudflareのこれらの取り組みは、推論インフラのコスト効率化という業界全体の課題に対する実践的なアプローチを示している。大規模な推論需要に対してデータセンター投資を抑えながらスケールできるアーキテクチャは、AI企業・クラウドプロバイダー双方にとって重要な競争要素となっており、今後の業界標準に影響を与えうるとみられている。

InfoQinfoq.com

5. MetaがARI(Assured Robot Intelligence)を買収:ヒューマノイドロボット基盤モデル開発へ

MetaはヒューマノイドロボットのFoundationモデルを開発するスタートアップ「Assured Robot Intelligence(ARI)」を買収した。ARIの共同創業者であるXiaolong Wang氏とLerrel Pinto氏はMetaのSuperintelligence Labs部門に加わり、ロボット知能の研究開発をリードする。これはMetaがロボティクス分野への本格参入を示す大きな動きだ。

Superintelligence Labs部門は、Meta全体のAI研究の中核として位置づけられており、汎用AIに向けた長期的な基礎研究を担っている。ARI買収によりロボティクス基盤モデルの研究能力を強化し、Google DeepMindやOpenAIのロボット分野への投資に対抗する姿勢を明確にした。

ヒューマノイドロボット市場は2026年に入り急速に拡大しており、Boston Dynamics・Figure・Physical Intelligence・1Xなど多数のプレイヤーが参入している。MetaがLlama 4を含むオープンソースAIの強みをロボティクスに活用できれば、エコシステム構築において先行できる可能性がある。ロボット用Foundation Modelの開発は現在最も注目度の高いAI研究領域の一つとなっている。

TechCrunchtechcrunch.com

6. Anthropic、金融セクター向けに10種の事前設定AIエージェントを公開

Anthropicは投資銀行・資産管理・保険会社などの金融機関が行う典型的な業務を自動化するよう設計された、10種の事前設定AIエージェントをリリースした。これらのエージェントはClaudeの最新モデルを基盤とし、金融特有のコンプライアンス要件やワークフローに対応した形で構成されている。リスク分析、ポートフォリオレポート生成、顧客対応、規制書類処理などの業務が対象とされている。

金融セクターへのAIエージェント展開は、高い精度・信頼性・監査可能性が求められるため、一般ビジネス向けと比べてより慎重なアプローチが必要とされる。Anthropicは安全性の研究でも知られており、金融機関が求めるエンタープライズグレードの信頼性を訴求点としている。また金融特化型エージェントのリリースはAI企業にとって法規制の多い業界への本格参入を示すマイルストーンだ。

このリリースはAnthropicのエンタープライズ戦略における重要な一手であり、OpenAIやMicrosoftがCopilotで進める企業向けAI展開に対抗する動きと解釈できる。金融セクターにおけるAIエージェントの採用が加速すれば、規制当局の関与も増加すると予想され、AIガバナンスの観点からも今後の展開が注目される。

Anthropicanthropic.com

7. ML-Master 2.0:24時間バジェットでMLE-Benchメダル率56.44%を達成

自律型AIエージェント「ML-Master 2.0」が24時間の予算制限下でOpenAIのMLE-Benchにおいて56.44%のメダル率を達成した。これはエンドツーエンドの機械学習研究を汎化するエージェントフレームワークに向けた初めての実質的な結果とされており、AIが自律的にMLリサーチを遂行する可能性を示す重要な指標だ。

ML-Master 2.0は数日〜数週間にわたる自律的な作業を目指して設計されており、データ探索から仮説設定、実験設計、コーディング、結果分析まで一連のMLパイプラインを自動化できる。従来のAIアシスタントが単一のタスク応答に留まるのに対し、長期的な研究課題に継続的に取り組むエージェント型のアーキテクチャを採用している。

科学的研究の自動化は、AI研究コミュニティにおいて「AIによる科学の加速」の中核をなすテーマだ。MLE-Benchにおける高スコアは、単なるコーディング補助を超えて独立した研究者として機能するAIの実現が近づきつつあることを示唆している。ただし汎化性能・再現性・倫理的側面については引き続き議論が必要な分野でもある。

Crescendo AIcrescendo.ai