智能体系统★ 评分 6.2

Learning Unanimously Acceptable Lotteries via Queries

Davin Choo, Paul W. Goldberg, Nicholas Teh
2026年4月26日
关键词
查询复杂度成员查询统一可接受彩票低维线性规划学习增强算法

核心发现

  1. 单个主体的接受区域可被视为 simplex 上的半空间;通过纯彩票查询与边上的二分搜索,能以 O(m log(1/ε)) 次成员查询精确恢复该半空间,或判定接受/拒绝全体彩票。
  2. 多主体情形可用“遇到违例才学习”的方式逐步补充约束:确定性算法始终正确地返回全民接受的彩票或 Null,最坏查询复杂度为 O(n^2 + nm log(1/ε))。
  3. 引入 Clarkson 式采样-重加权后,随机算法在期望上只需学习 O(min{n, m^3 log n}) 个主体的约束,把总查询压到 O(nm log n + min{n,m^3 log n}·m log(1/ε))。
  4. 下界证明这些依赖关系基本不可避免:任何总是正确的算法都需要 Ω((n-min{n,m}) + (min{n,m}-1) log(1/ε)) 次查询,且单主体时仍需 Ω(m) 次。
  5. 学习增强版本利用主体顺序预测与候选彩票 warm-start,可在预测准确时明显减少查询;但即使预测失真,最坏情况仍保持与无预测版本同阶的鲁棒性。

实验规模

无实证实验;全文是纯理论工作。评估完全建立在抽象查询模型上:n 个主体、m 个备选方案、ε-量化效用/阈值、以及仅返回 True/False 的成员查询 oracle。对比对象是全量 elicitation、确定性自适应算法、Clarkson 风格随机算法,以及带 permutation/lottery 预测的学习增强版本;没有数据集、训练参数、样本数或真实系统部署实验。

局限性

依赖非常强的理想化假设:线性期望效用、精确成员查询、以及 ε-量化参数;现实中的噪声反馈、非线性偏好、答复不一致和模型误设都未被覆盖。论文几乎没有任何实证或仿真,只能证明在理论 oracle 模型下的渐近查询复杂度,无法说明常数项、工程可扩展性或实际部署收益。随机算法与学习增强算法的改进主要体现在期望意义上的渐近界,且仍保留较高的 n 级验证开销,因此离大规模治理场景的直接落地还有距离。

Paper ID: 2604.17505