智能体系统★ 评分 6.0
LLM-Guided Strategy Synthesis for Scalable Equality Saturation
Chenyun Yin, Youwei Xiao, Yuze Luo, Yuyang Zou, Yun Liang
2026年4月26日
关键词
等式饱和LLM引导策略合成EqSatLe-graph优化
核心发现
- EqSatL 将策略显式拆成 ruleset partition、flow/schedule 和 simplify 三层控制面,使 EqSat 策略从一次性脚本变成可检查、可复用的独立对象。
- 证明驱动的 rewrite motif 缓存把成功运行压缩成 tag 链证据,再结合规则依赖风险模型与 LLM 简化提示,把搜索从盲目试错转为带反馈、带稳定性约束的离线合成。
- 在向量化基准上,EggMind 相对 full EqSat 将最终成本降低 45.1%、峰值内存降低 69.1%,相对专家策略 Isaria 的运行速度提升 2.21×,说明策略层控制确实能改善资源-质量折中。
- 在 17 个 XLA HLO 案例和 9 个 EqMap carry benchmark 上仍能保持收益,但实验主要覆盖少量特定 rewrite space,证明的是定向迁移能力,而不是通用自动编译问题已被彻底解决。
实验规模
实验主要覆盖三个场景:向量化编译基准沿用 Isaria/Diospyros 的 2D convolution 和 matrix multiplication 工作负载,8 个案例用于离线演化,其余用于持出测试;主对比与消融各在 15 个向量化案例上评估;迁移实验在 17 个 XLA HLO 代数化简案例上进行;逻辑综合 case study 使用 9 个 EqMap carry-chain benchmark。对比基线包括 full EqSat、专家调优的 Isaria、原始/增强 EqMap 流程,以及 raw egglog 或 EqSatL 上的 free-agent 搜索。离线合成使用 Doubao-Seed-2.0-pro,论文未报告其参数量;合成过程耗时 31.8 分钟、53 次模型请求、4.35M 输入 token 和 36.6K 输出 token。实验硬件为双 Intel Xeon Gold 6348 CPU、56 物理核、2 TiB 内存,在线 EqSat 统一设置 600s 超时与 25GB 内存上限。
局限性
主要验证集中在三个较窄的编译/综合家族,且 rewrite 规则、代价模型和 EqSatL 结构都高度定制,外推到其他 EqSat 任务的证据仍然有限。收益依赖离线 LLM 搜索、手工设计的风险模型、标签体系和超参数,方法的稳定性与成本对模型质量较敏感。与更强的自动策略搜索或统一编译优化框架相比,横向比较仍不算充分,因此更像一套有效的领域工程方案,而非普适范式突破。