Arxiv Insights - Curated Research Intelligence

核心发现

记忆、技能、规则不是三类孤立问题，而是同一“经验压缩谱系”上不同压缩率的输出；压缩越高，存储与检索开销越低，但上下文特异性越弱。
对22篇主论文、1136条参考文献的引文分析显示跨社区引用率低于1%，说明记忆社区和技能社区在解决同类子问题却几乎互不借鉴。
将20多个系统映射到谱系后发现它们都停留在固定层级，Level 3规则学习几乎空白，真正缺失的是能按轨迹价值自适应选择压缩层级的“对角线”系统。
汇总的跨层结果表明更高压缩通常带来更好的迁移性和下游效果，但评价指标与压缩层级强耦合、知识生命周期管理也长期被忽视，因此需要多层存储与持续治理。

实验规模

主要是文献综述与二次分析，而非作者自建大规模实验：对22篇主论文的1136条参考文献做引文统计；将20多个现有LLM智能体记忆/技能/规则系统映射到L0-L3四级谱系；汇总7项跨层性能对比（如SkillRL、Trace2Skill、SkillsBench、EvoSkill、RuleShaping等）作为间接证据。论文未报告新的模型训练、参数规模或统一基准上的自有实验。

局限性

核心结论主要来自概念建模和异质文献汇总，而不是作者自建的统一实验，因此“更高压缩更优”“存在缺失对角线”等判断仍偏推断性。文中给出的压缩比多为近似值，且不同论文的基准、指标和任务不可直接比较，跨层性能结论容易受到选择性引用与任务偏差影响。四级谱系本身也是简化抽象，现实中的经验压缩很可能是连续而非离散分层，边界划分缺少严格可证性。