視覚推論の新フロンティア——ニューロシンボリックAIとVisual Primitivesが拓く道
DeepSeekの視覚プリミティブ統合手法とTufts大学のニューロシンボリックAIが、視覚的推論と省エネ型ロボット制御で大きな飛躍を示した。
DeepSeekの視覚プリミティブ統合手法とTufts大学のニューロシンボリックAIが、視覚的推論と省エネ型ロボット制御で大きな飛躍を示した。
Hugging Faceのトレンド論文でロボット制御・文書解析・研究自動化の最前線が一気に更新された週だった。
Hugging Faceが自律的にLLMポスト訓練ワークフロー全体を実行するml-internを公開。GenericAgentはトークン効率を高める自己進化型エージェントを提案し、MITは訓練速度を倍増させる新手法を発表した。
自律的な科学文献探索AIのベンチマーク、映像生成とロボット制御を統合した新アーキテクチャ、そして人間の科学者がAIを上回るという研究結果が立て続けに発表され、AIと科学の関係が問い直されている。
自律的な科学論文探索を評価するAutoResearchBench、空間知性評価を刷新するReVSI、リアルタイム物体検出のRF-DETRなど最新AI研究論文が相次いで発表された
空間認識評価の欠陥を修正するReVSIから、ブロック拡散モデルを利用したDFlash、エッジデバイス向け三値LLM推論のBitnet.cppまで、実用的な高速化・評価改善研究が相次いで発表された。
Hugging Faceがポストトレーニングを自動化するml-internを公開、マルチエージェント世界モデリングの研究も加速している。
Hugging Faceが論文読みからモデル訓練まで一気通貫で自動化するAIエージェントを公開し、研究ループそのものが変わりつつある。
Hugging Faceがエンドツーエンドの研究自動化エージェントml-internを公開し10時間でGPQA 32%を達成。MultiWorldのマルチエージェント世界モデル、物理法則を埋め込んだ流体・気候予測AIなど、2026年春の研究最前線が活況だ。
Hugging Faceで注目を集める最新論文から、マルチエージェント・3Dガウシアン・リアルタイム音声対話・動画編集など多彩な研究フロンティアが浮かび上がる。
AIエージェントの信念精度を動的環境で評価するClawArena、スキルを訓練時に内面化するSKILL0、そして開放的発見を実現するマルチエージェント進化フレームワークがHugging Faceでトレンド上位に
AIが完全自律で学術論文を執筆し査読を通過した歴史的な成果が報告された一方、LightRAGやMem0など記憶・検索系の実用研究もHugging Faceでトレンド入り
NetflixがVOIDを公開しオープンAI研究に参入、LangMARL・Agent Q-Mixがマルチエージェント強化学習の新地平を切り開く
Hugging Faceがオープンソースの現状レポートを公開。ByteDanceなど中国Big Techが論文で圧倒的影響力を持つ一方、韓国・医療AIが急成長している。