論文・研究

AlphaEvolveが56年ぶり行列演算を更新——DeepSeek mHCほか研究最前線

Google DeepMindのAlphaEvolveがStrassen法以来56年ぶりに行列乗算アルゴリズムを改善し、DeepSeekのmHCがLLM訓練安定性に「突破口」をもたらした。KV缶最適化・物理制約AI等の研究も活発だ。

1. Google DeepMind「AlphaEvolve」発表——Geminiと進化的アルゴリズムで56年ぶりの行列演算改善

Google DeepMindはGeminiを活用した汎用コーディングエージェント「AlphaEvolve」を発表した。大規模言語モデルと進化的アルゴリズムを組み合わせたシステムで、LLMが候補アルゴリズムを生成し、自動評価器がその優劣を判断してフィードバックするサイクルを繰り返すことで、人間が長年解けなかった問題に挑む。

最大の成果は、4×4の複素数値行列を48回のスカラー乗算で掛け合わせる手順を発見したことだ。これは1969年のStrassen法以来56年ぶりの改善で、数学・計算機科学における歴史的成果とされる。実用面では、AlphaEvolveをGoogleのデータセンタースケジューリングに適用することで世界中の計算資源の平均0.7%を継続的に回収し、GeminiアーキテクチャのTPUカーネルを23%高速化してGemini学習時間を1%短縮する効果も確認されている。

現在Google Cloudでプライベートプレビューとして提供開始されており、数学・コンピューティングにとどまらず、アルゴリズムで記述できあり自動検証可能なあらゆる問題(材料科学・創薬・サステナビリティ等)への応用が期待されている。AlphaEvolveの登場はAIが人類の知的遺産を再発見し更新するフェーズに入ったことを示す象徴的なニュースだ。

Google DeepMinddeepmind.google

2. DeepSeek mHC:「流形制約付きハイパーコネクション」がLLM訓練安定性を根本から変える

DeepSeekは「mHC(Manifold-Constrained Hyper-Connections)」と題した研究論文を発表した(arXiv: 2512.24880)。これはByteDanceの提案したHyper-Connections(HC)手法を基礎として、残差接続空間に数学的制約(多様体への射影)を導入することで、深層モデルの訓練安定性とスケーラビリティを同時に改善するものだ。

HCは複数の内部ストリームで情報を多角的に流す仕組みとして性能向上に寄与するが、残差接続の「恒等マッピング(Identity Mapping)特性」を損なうため訓練不安定化を招くという欠点があった。mHCはすべての混合ステップを数学的に制約することで情報量を一定に保ち、数百層を経ても情報フローを予測可能な状態に維持する。

3B・9B・27Bパラメータモデルでの検証実験では、mHCが安定して学習を完了する一方、制約なしHCはしばしば発散した。追加の訓練オーバーヘッドはわずか6.7%に抑えられており、実用性も高い。アナリストはこれを「モデルのスケール拡大方法を根本から変えうる突破口」と評価しており、2026年以降のLLM開発に広く取り込まれる可能性がある。

DeepSeek AI Blogdeepseek.ai

3. Google TurboQuant——KVキャッシュのメモリボトルネックをICLR 2026で解消

Googleの研究チームはICLR 2026でTurboQuantを発表した。大型AIモデルの推論における最大のボトルネックのひとつであるKV(Key-Value)キャッシュのメモリオーバーヘッドを大幅に削減するアルゴリズムだ。長文コンテキストや長時間の会話を処理する際にKVキャッシュはGPUメモリを急速に圧迫するが、TurboQuantはその圧縮手法を革新することで処理効率を向上させる。

KVキャッシュのメモリ問題はモデルの文脈長拡大(100万トークン超など)が進むほど深刻化しており、TurboQuantが業界標準として採用されればMixtral・LLaMA・Geminiをはじめとする多様なモデルの長文推論コストを著しく下げられる可能性がある。ICLR(International Conference on Learning Representations)はAI分野のトップ会議の一つであり、ここで発表されたことはその技術的信頼性を裏付けている。

実装面では既存のモデルアーキテクチャを変更せずにプラグイン的に適用できる設計とのことで、デプロイのハードルが低い点も注目される。クラウドプロバイダーや推論専用サービスがTurboQuantを組み込むことで、ユーザー向けのLLMレスポンスのコスト・速度が改善されることが期待される。

Lambda AIlambda.ai

4. Microsoft Research「World-R1」——強化学習と3D制約でビデオ生成の品質と整合性を改善

Microsoft Researchは2026年4月27日、World-R1フレームワークを公開した(Hugging Face Papers掲載)。このフレームワークはビデオ生成モデルに強化学習(RL)と専門的なテキストデータセットを用いて3D空間制約を組み込む手法で、映像の視覚的品質と現実世界との空間的一貫性を同時に改善することを目的とする。

従来のビデオ生成モデルは画質や動きの滑らかさは向上してきた一方、3D空間の論理的整合性(物体の奥行き・遠近・剛体運動など)が崩れることが多く、特に長尺動画や複雑なシーンで顕著だった。World-R1はこの問題に対して強化学習の報酬信号として3D幾何制約を導入することで対処する。

視覚的品質とスケーラビリティを保ちながら3D整合性を改善したと報告されており、映画制作・ゲーム・シミュレーション・自動運転向けの合成データ生成など幅広い応用が見込まれる。Hugging Face Daily Papersで4月第4週のトレンド論文として取り上げられ、コミュニティからも高い注目を集めている。

Hugging Facehuggingface.co

5. ハワイ大学チームが「物理制約付き機械学習」の新アルゴリズムを発表——流体力学・気候モデルへの応用

ハワイ大学マノア校の研究チームが「Physics-Informed Machine Learning(PIML)」分野の新アルゴリズムをAIP Advances誌に発表した。同アルゴリズムは、AIが複雑なデータセットを処理する際に物理法則を遵守できる仕組みを提供するもので、流体力学や気候モデリングにおける予測精度の大幅な向上をもたらした。

従来のPIMLは物理法則を損失関数に組み込む際の最適化の困難さや、大規模問題へのスケール困難という課題を抱えていた。今回の手法はその制約を緩和し、より複雑な現実問題に適用できる汎用性を持つ。エネルギー・材料・航空宇宙・医療など、物理法則が支配する領域すべてでAI予測モデルの精度を底上げできる可能性がある。

研究チームはこのアルゴリズムをオープンソースとして公開予定としており、再現実験や派生研究の加速が見込まれる。物理モデルとデータ駆動AIを融合するアプローチは、純粋なデータ学習だけでは困難だった科学的発見を後押しする重要な方向性として、2026年の研究コミュニティでの注目が高まっている。

Crescendo AIcrescendo.ai