自然语言处理★ 7.5
KVSlimmer: Theoretical Insights and Practical Optimizations for Asymmetric KV Merging
Lianjun Liu, Hongli An, Weiqi Yan, Xin Du, Shengchuan Zhang, Huazhong Liu, Yunshan Zhong
KVSlimmer通过谱分析揭示QKV不对称性,并提出一种基于精确Hessian的无梯度闭式解,实现高效且高性能的LLM KV缓存合并。
KV缓存长上下文LLM缓存压缩Hessian谱分析