智能体系统★ 评分 4.1

Governing the Agentic Enterprise: A Governance Maturity Model for Managing AI Agent Sprawl in Business Operations

Vivek Acharya
2026年4月26日
关键词
代理式AI治理治理成熟度模型代理扩散多智能体仿真业务价值评估

核心发现

  1. 构建了AAGMM五级成熟度模型与12个治理域,并将其映射到NIST AI RMF与ISO/IEC 42001,形成一套面向企业代理式AI的治理框架。
  2. 在作者自建的多智能体仿真中,治理成熟度越高,代理扩散、风险事件和治理成本结构越可控,任务完成率与综合NBV越高,说明“治理投入”在该模型里被定义为价值放大器。
  3. 仿真结果显示L3是最低可用治理门槛:相较L2,NBV显著提升,且代理间协调、权限控制和人工介入等机制在此阶段开始产生明显收益。
  4. L4到L5的收益主要来自自动化与预测性治理,作者据此声称存在“automation dividend”,即更高成熟度下治理成本反而下降、业务指标继续改善。

实验规模

使用Python构建的多智能体仿真框架,固定随机种子seed=42;设定5个业务场景(Greenfield、Scaling、Cross-Functional、Adversarial、Optimization),5个治理成熟度等级(L1-L5),共750次仿真运行(5×5×30),即每个场景-等级单元30次重复。仿真假设包含5个业务函数、每类6种能力/共30类代理类型,任务难度分布为40%简单、35%中等、20%复杂、5%关键;评估指标包括Sprawl Index、每千次行动风险事件率、任务完成率、Delegation Safety Rate、Governance Cost Ratio和NBV。对比基线主要是不同治理等级之间的自对照,没有真实企业数据集或外部强基线模型。

局限性

主要局限在于:全部证据来自作者自建仿真,参数、权重和控制强度多由行业报告与经验设定,并未经过真实企业部署验证,因此结论更像是规范性推演而非实证因果证据。其次,论文缺少外部强基线、系统消融和敏感性分析,尤其无法证明12个治理域中每一项都具有独立必要性。最后,文中大量高显著性结果建立在同一模拟器与固定种子之上,统计显著并不自动等于现实可迁移性。

Paper ID: 2604.16338