Arxiv Insights - Curated Research Intelligence

核心发现

EqSatL 将策略显式拆成 ruleset partition、flow/schedule 和 simplify 三层控制面，使 EqSat 策略从一次性脚本变成可检查、可复用的独立对象。
证明驱动的 rewrite motif 缓存把成功运行压缩成 tag 链证据，再结合规则依赖风险模型与 LLM 简化提示，把搜索从盲目试错转为带反馈、带稳定性约束的离线合成。
在向量化基准上，EggMind 相对 full EqSat 将最终成本降低 45.1%、峰值内存降低 69.1%，相对专家策略 Isaria 的运行速度提升 2.21×，说明策略层控制确实能改善资源-质量折中。
在 17 个 XLA HLO 案例和 9 个 EqMap carry benchmark 上仍能保持收益，但实验主要覆盖少量特定 rewrite space，证明的是定向迁移能力，而不是通用自动编译问题已被彻底解决。

实验规模

实验主要覆盖三个场景：向量化编译基准沿用 Isaria/Diospyros 的 2D convolution 和 matrix multiplication 工作负载，8 个案例用于离线演化，其余用于持出测试；主对比与消融各在 15 个向量化案例上评估；迁移实验在 17 个 XLA HLO 代数化简案例上进行；逻辑综合 case study 使用 9 个 EqMap carry-chain benchmark。对比基线包括 full EqSat、专家调优的 Isaria、原始/增强 EqMap 流程，以及 raw egglog 或 EqSatL 上的 free-agent 搜索。离线合成使用 Doubao-Seed-2.0-pro，论文未报告其参数量；合成过程耗时 31.8 分钟、53 次模型请求、4.35M 输入 token 和 36.6K 输出 token。实验硬件为双 Intel Xeon Gold 6348 CPU、56 物理核、2 TiB 内存，在线 EqSat 统一设置 600s 超时与 25GB 内存上限。

局限性

主要验证集中在三个较窄的编译/综合家族，且 rewrite 规则、代价模型和 EqSatL 结构都高度定制，外推到其他 EqSat 任务的证据仍然有限。收益依赖离线 LLM 搜索、手工设计的风险模型、标签体系和超参数，方法的稳定性与成本对模型质量较敏感。与更强的自动策略搜索或统一编译优化框架相比，横向比较仍不算充分，因此更像一套有效的领域工程方案，而非普适范式突破。