智能体系统★ 评分 4.1

Experience Compression Spectrum: Unifying Memory, Skills, and Rules in LLM Agents

Xing Zhang, Guanghui Wang, Yanwei Cui, Wei Qiu, Ziyuan Li, Bing Zhu, Peiyang He
2026年4月26日
关键词
LLM智能体经验压缩谱系记忆系统技能发现规则抽取

核心发现

  1. 记忆、技能、规则不是三类孤立问题,而是同一“经验压缩谱系”上不同压缩率的输出;压缩越高,存储与检索开销越低,但上下文特异性越弱。
  2. 对22篇主论文、1136条参考文献的引文分析显示跨社区引用率低于1%,说明记忆社区和技能社区在解决同类子问题却几乎互不借鉴。
  3. 将20多个系统映射到谱系后发现它们都停留在固定层级,Level 3规则学习几乎空白,真正缺失的是能按轨迹价值自适应选择压缩层级的“对角线”系统。
  4. 汇总的跨层结果表明更高压缩通常带来更好的迁移性和下游效果,但评价指标与压缩层级强耦合、知识生命周期管理也长期被忽视,因此需要多层存储与持续治理。

实验规模

主要是文献综述与二次分析,而非作者自建大规模实验:对22篇主论文的1136条参考文献做引文统计;将20多个现有LLM智能体记忆/技能/规则系统映射到L0-L3四级谱系;汇总7项跨层性能对比(如SkillRL、Trace2Skill、SkillsBench、EvoSkill、RuleShaping等)作为间接证据。论文未报告新的模型训练、参数规模或统一基准上的自有实验。

局限性

核心结论主要来自概念建模和异质文献汇总,而不是作者自建的统一实验,因此“更高压缩更优”“存在缺失对角线”等判断仍偏推断性。文中给出的压缩比多为近似值,且不同论文的基准、指标和任务不可直接比较,跨层性能结论容易受到选择性引用与任务偏差影响。四级谱系本身也是简化抽象,现实中的经验压缩很可能是连续而非离散分层,边界划分缺少严格可证性。

Paper ID: 2604.15877