LLM推論

(3 件)

論文・研究 2026年5月10日

KVキャッシュ革命からマルチモーダルRAGまで——LLM推論効率化と知識検索の最前線

GoogleのTurboQuantがKVキャッシュを6倍圧縮してH100で8倍高速化し、CloudflareはPrefill/Decode分離アーキテクチャで推論コストを刷新。マルチモーダルRAGやMollifier Layers・LLM-Emuなど、LLMの効率・精度・評価を根本から変える研究が続々公開された。

論文・研究 2026年4月27日

AIが論文を書く時代——自律的科学探索システムがNature掲載

SakanaAIのAI Scientist v2が完全自動生成論文でILCRワークショップの査読を通過し、Natureへの掲載が実現した

論文・研究 2026年3月31日

推論の限界を問う：ChainofThought・報酬ハッキング・分散推論の最前線

arXivの最新論文群がAIエージェントの推論構造・強化学習の安全性・分散モデル推論基盤を多角的に解剖し、次世代AIシステム設計の課題を浮き彫りにした。