毎朝 7:00 更新

RAG

(2 件)

論文・研究 2026年5月10日

KVキャッシュ革命からマルチモーダルRAGまで——LLM推論効率化と知識検索の最前線

GoogleのTurboQuantがKVキャッシュを6倍圧縮してH100で8倍高速化し、CloudflareはPrefill/Decode分離アーキテクチャで推論コストを刷新。マルチモーダルRAGやMollifier Layers・LLM-Emuなど、LLMの効率・精度・評価を根本から変える研究が続々公開された。

論文・研究 2026年4月7日

AI Scientist-v2が査読論文を自律生成・LightRAG・Mem0など実用研究が続々トレンド入り

AIが完全自律で学術論文を執筆し査読を通過した歴史的な成果が報告された一方、LightRAGやMem0など記憶・検索系の実用研究もHugging Faceでトレンド入り