論文・研究

SubQ:トランスフォーマーを超えた完全サブクォドラティックLLM登場

わずか13名のチームが開発したSubQが12Mトークンコンテキストを持つ完全サブクォドラティックアーキテクチャを実装し、Claude Opus 4.7の5分の1のコストで長文脈推論を実現した。

1. SubQ:初の完全サブクォドラティックLLMが登場、12Mトークン対応

スタートアップ「Subquadratic」(マイアミ、従業員13名)が、世界初の完全サブクォドラティックスパースアテンション(SSA)アーキテクチャを採用したLLM「SubQ」を正式リリースした。同社は出自ステルスとともに2500万〜2900万ドルのシード資金を調達しており、AIアーキテクチャ研究の新しい方向性として業界から大きな注目を集めている。

従来のトランスフォーマーはトークン数nに対してO(n²)の計算複雑性を持ち、長文脈処理では計算コストが爆発的に増加するという根本的な制約がある。SubQはこの問題を解決するために設計されており、O(n)の計算複雑性でトークン間の重要な関係性のみに注目するスパースアテンション機構を採用した。12Mトークンの入力に対して通常のアテンション計算の約1000分の1の演算量で処理できると主張している。

性能面では「SubQ 1M-Preview」というテストモデルが、大量トークン入力時においてClaude Opus 4.7を上回る処理性能を示したとしている。12Mトークン推論を毎秒150トークンで処理し、コストは主要LLMの5分の1。コードリポジトリ全体分析、長文書の一括処理、多文書リサーチなどの用途に特化した設計となっている。

Subquadraticsubq.ai


2. TideGS:1GPUで10億パラメータ3D Gaussian Splattingの学習を実現

香港科技大学(HKUST)のSponge Computing Labが発表した「TideGS」は、単一GPU上で10億以上のプリミティブを使った3D Gaussian Splatting(3DGS)のトレーニングを可能にする手法だ。従来の3DGSは高品質なシーン再構成に膨大なGPUメモリを必要としており、大規模シーンへの適用は限られていた。

TideGSはメモリ効率化と並列化を組み合わせたアーキテクチャにより、従来比でオーダー単位のスケールアップを単一GPUで達成する。映画・ゲーム・XR向けのリアルタイム3D再構成や、医療画像・地理空間データへの応用が期待されている。Hugging Facingの注目論文として5月19日に掲載され、コミュニティから大きな反響を呼んでいる。

3DGSはNeRF(Neural Radiance Fields)に代わるリアルタイム3D表現として急速に普及しており、TideGSはその実用展開における主要な計算コストのボトルネックを解消する可能性を持つ。VFXや映像制作分野でのリアルタイムプレビューや資産生成パイプラインへの統合が加速するとみられる。

Hugging Facehuggingface.co


3. LongLive-2.0:NVFP4並列インフラで長尺動画生成のボトルネックを突破

「LongLive-2.0」は、長尺動画生成における訓練・推論のボトルネックを解決するためのNVFP4ベース並列インフラを提案した研究だ。シーケンス並列自己回帰訓練と拡散モデルファインチューニングを組み合わせることで、数分規模の動画生成において従来の分散訓練システムが抱えていたメモリ効率と速度の課題を克服している。

現在の動画生成AIは数秒から十数秒程度のクリップ生成に留まることが多く、映画・ドキュメンタリー・エンタメ制作で求められる数分規模の連続動画生成は依然として困難だった。LongLive-2.0のアーキテクチャはこの壁を技術的に乗り越える設計となっており、実用的な長尺AI動画生成に向けた大きな一歩として評価されている。

生成AIの動画領域は2026年において最も激しい技術競争が続く分野の一つであり、Sora、Kling、Wan Video、Veo 3といった商用モデルが次々と能力を向上させている状況下で、このような基盤研究が産業実装に向けた理論的根拠を提供している。

Hugging Facehuggingface.co


4. AIが科学論文を分析し2〜3年先の研究トレンドを予測

カールスルーエ工科大学(KIT)の研究チームがNature Machine Intelligence誌に発表した研究によれば、大規模言語モデルと機械学習を組み合わせることで、科学論文中の概念間の関係性をマッピングし、今後2〜3年以内に浮上する研究トレンドを予測することが可能になった。材料科学の文献を対象にした実証実験では、この手法が従来の専門家レビューでは気づきにくかった新しい研究方向を特定できることが示された。

この手法の核心は「概念グラフ」の構築にあり、何万もの論文から抽出した用語・実験手法・材料特性などの概念ノードと、それらの関係エッジを自動的にマッピングする。グラフのトポロジーを分析することで、現在は辺境にあるが将来中心的になる可能性の高い研究クラスターを識別できる。

AIを用いた科学的発見の加速(AI for Science)は2026年の主要研究テーマの一つであり、このような「メタリサーチ」ツールは研究者が限られた時間とリソースを最も有望な領域に集中させる意思決定支援に直結する。製薬・素材・エネルギー分野での応用が特に期待されている。

Tech Xploretechxplore.com


5. Mega-ASR:複合データ構築で現実世界の音声認識精度を大幅改善

「Mega-ASR」は、現実環境における音声認識の頑健性を大きく向上させるフレームワークだ。複合データ構築手法(compound-data construction)と段階的な音響・意味的最適化技術を組み合わせることで、雑音環境・多言語混在・方言差異といった実運用上の困難な条件に対するASR(自動音声認識)モデルの性能を改善する。

現行のASRシステムはクリーンな音声に対しては高精度を示す一方、実世界のノイズや発話パターンの多様性に対して性能が著しく低下するという課題を抱えている。Mega-ASRはこの「訓練分布と実世界分布のギャップ」を埋めるため、意図的に多様な劣化条件を含む複合訓練データセットを構築し、段階的な学習カリキュラムでモデルを最適化する。

音声AIは対話型エージェントやコールセンター自動化、医療記録の音声入力など多くの産業用途で普及しつつあり、現実世界での信頼性向上は実装拡大の直接的な加速要因となる。コールセンターや医療の文字起こしシステムへの統合で特に大きな影響が期待される研究だ。

Hugging Facehuggingface.co