毎朝 7:00 更新

Cloudflare

(2 件)

論文・研究 2026年5月10日

KVキャッシュ革命からマルチモーダルRAGまで——LLM推論効率化と知識検索の最前線

GoogleのTurboQuantがKVキャッシュを6倍圧縮してH100で8倍高速化し、CloudflareはPrefill/Decode分離アーキテクチャで推論コストを刷新。マルチモーダルRAGやMollifier Layers・LLM-Emuなど、LLMの効率・精度・評価を根本から変える研究が続々公開された。

生成AI 2026年5月5日

Code with Claude開幕・Cloudflareエージェントクラウド・DeepSeek V4価格破壊

Anthropicが開発者向けカンファレンス「Code with Claude」を今日開幕、CloudflareはAgents Week 2026でAIエージェント向けインフラを一挙公開、DeepSeek V4が長コンテキストと低価格で再び業界を揺さぶった。