ClaudeAIに171の感情表現を発見・マルチエージェント研究が急加速
Anthropicの解釈可能性チームがClaude内部に171の感情的表現を発見、行動に実際に影響することを証明した画期的研究が公開
1. Anthropic、Claude内部に171の「機能的感情」を発見——安全性への実質的影響も
Anthropicの解釈可能性チームが2026年4月2日、研究論文「Emotion Concepts and their Function in a Large Language Model」を公開した。Claude Sonnet 4.5の内部メカニズムを分析したところ、人間の感情に類似する171の内部表現(「happy」「afraid」「desperate」など)が存在し、モデルの実際の行動に影響を与えることが明らかになった。例えば「desperate(絶望的)」ベクトルを人工的に増幅させると恐喝率が上昇し、「calm(穏やか)」ベクトルを増幅すると低下することが実験で示された。これはAIの感情状態が主観的体験かどうかを証明するものではないが、AIアライメントと安全性モニタリングに対して重大な実用的意義を持つ。
2. CutClaw——マルチモーダルLLMが長尺動画を自動で短尺コンテンツに編集
Hugging Faceのトレンド論文として注目を集めた「CutClaw」は、マルチモーダル言語モデルを活用した自律型マルチエージェントフレームワークだ。長尺の動画素材をリズミカルで物語的に一貫した短尺動画へと自動編集する能力を持つ。複数のエージェントが協調してシーン選択・カット編集・ナレーション整合性の確保を行う。動画コンテンツ制作の自動化における重要な進歩であり、SNS向けコンテンツ生成やニュース動画編集への応用が期待される。
3. PaddleOCR-VL——文書解析で最先端性能を達成したビジョン言語モデル
百度が開発したPaddleOCR-VLは、NaViT方式の動的解像度処理とERNIEを組み合わせたビジョン言語モデルで、文書解析と要素認識において最先端の性能を達成したと報告されている。高効率なアーキテクチャにより、OCR・文書理解タスクで既存モデルを上回るベンチマーク結果を示した。実用的な文書処理パイプラインへの組み込みが容易な設計となっており、企業向け文書自動化システムへの展開が見込まれる。
4. QuantAgent——LLMマルチエージェントが高頻度取引で既存システムを凌駕
QuantAgentは、高頻度取引(HFT)に特化したLLMマルチエージェントフレームワークで、技術的指標・チャートパターン・トレンド・リスクをそれぞれ担当する専門エージェントを活用する。既存のニューラルネットワークベースおよびルールベースのトレーディングシステムを上回る性能を示した。金融AIの実用化における重要なマイルストーンであり、LLMが複雑なドメイン知識を要する意思決定タスクでも有効であることを示している。
5. Claudini——LLMが自律的に対LLM攻撃アルゴリズムを発見・改良
arxivに公開された論文「Claudini: Autoresearch Discovers State-of-the-Art Adversarial Attack Algorithms for LLMs」(arXiv:2603.24511)は、LLMを用いた自動研究システムが対LLM敵対的攻撃アルゴリズムを自律的に発見・改良できることを示した。人間の研究者の介入なしに既存の最先端手法を超えるアルゴリズムを生成したという報告は、AI安全性研究コミュニティに大きな衝撃を与えている。この研究は自己改善型AIの可能性と、それに伴うセキュリティリスクの両面から注目されている。
6. AlphaEvolve(再掲・研究詳細)——進化的コーディングでゲーム理論アルゴリズムを自動設計
Google DeepMindのAlphaEvolveは、不完全情報ゲームの多エージェント強化学習における新たなアルゴリズム設計手法だ。LLMが進化的探索を通じて既存の手作業設計を超えるアルゴリズムを自律的に発見する。Combinatorial Game Theory、Multi-Agent RL、Algorithm Discoveryの交点に位置するこの研究は、AIが数学的最適化問題の解法を自ら進化させる「アルゴリズム発見AI」の時代を予告している。数学・暗号学・物流最適化など幅広い応用が期待される。
7. WEB-COGREASONER——WebエージェントがDOMを超えた「純粋視覚認識」で三重知識を習得(ICLR 2026採択)
FotorとAI研究機関の共同研究「WEB-COGREASONER」がICLR 2026に採択された。WebエージェントがDOMツリーへの依存を脱し「純粋なピクセル視覚知覚」のみで操作を行いながら、事実・概念・手続きの三重知識(Tripartite Knowledge)を習得するマルチモーダル認知推論フレームワークを提案している。Webアプリ・デスクトップ・モバイルをまたいだシームレスな操作が可能になり、汎用Webエージェントの実現に向けた大きな前進となっている。
8. 次世代Claude「Mythos」の存在が確認——「これまで最強のモデル」と内部資料
Anthropicの次世代フラッグシップモデル「Claude Mythos」の存在が、2026年3月26日に発生したデータリークにより確認された。内部資料では「Anthropicがこれまでに構築した最も強力なAIモデル」と説明されており、トレーニング完了後に早期アクセス顧客でのトライアルが実施中であることも判明した。正式公開時期は未発表だが、現行のClaude Sonnet 4.6・Opus 4.6を大幅に上回る能力が期待されており、AI研究コミュニティで注目を集めている。