技术周评(海外) | 繁荣的规则与荒芜的角落:MIT万字报告揭开AI治理的结构性错位
来源
Mapping the AI Governance Landscape: April 2026 Update,
https://airisk.mit.edu/blog/mapping-the-ai-governance-landscape-april-2026-updat
01 治理的繁荣与隐蔽的缺口
过去几年,人工智能治理文件迅速增加。各国政府、国际组织与行业机构密集发布法规、指南、原则和声明,围绕人工智能逐步形成了一套规模庞大、层次复杂的治理体系。治理讨论明显升温,文本也在持续累积,但一个基础的问题始终没有被充分回答:这些治理文件究竟覆盖了哪些领域?又有哪些问题长期停留在边缘地带?
这并不是一个无关紧要的技术性问题。治理文本如何分布,往往会体现和影响监管注意力投向何处,制度资源优先流向哪里;也会决定哪些风险能够较早进入公共讨论,哪些后处理。如果现有治理持续集中于某些类型的问题,而对另一些问题缺乏足够关注,那么这种不均衡本身,就可能构成一种值得警惕的治理缺口。
麻省理工大学人工智能风险倡议(MIT AI Risk Initiative)于2026年4月发布的《AI治理图景映射》(Mapping the AI Governance Landscape: April 2026 Update)报告,借助对约1000份AI治理文件的系统分类,试图回答一个很直接的问题:当治理文本快速增长,AI治理究竟是在变得更全面,还是正在形成某种稳定的偏向?
02 给AI治理做一次“体检”:MIT的分析框架与方法论
报告以人工智能治理与监管档案(AI GOvernance and Regulatory Archive,AGORA)为基础展开分析。AGORA由乔治城大学安全与新兴技术中心(The Center for Security and Emerging Technology,CSET)维护,收录了约1000份与人工智能相关的治理文件,涵盖法律、政策、标准与指导意见等多种类型,是目前较为系统的AI治理文本资料库之一。不过,数据库中的文件主要来自美国,且以英语和联邦层级文本为主,因此报告所呈现的,更接近美国治理体系中的议题分布与表达习惯,未必能够直接代表全球AI治理的整体面貌。
在方法上,研究团队使用大语言模型构建分类流程,对每一份文件进行多维度标注。与此前的试验版本相比,此次更新将覆盖程度的评分标准由5级压缩为3级,即“无覆盖”“最低限度覆盖”和“良好覆盖”。这一调整并不只是技术性的简化,更反映出研究团队对分类可靠性的重新权衡:与其保留过于细密、但难以稳定区分的等级,不如采用更收敛的尺度,以提高人工校验与模型输出之间的一致性。
具体而言,报告主要从六个维度展开分析:其一是风险子领域覆盖,用以判断一份文件具体涉及哪些AI风险;其二是行业部门,考察治理讨论更多集中于哪些应用场景与产业领域;其三是AI生命周期阶段,观察治理更常介入数据处理、模型构建、部署还是运行监控;其四是治理主体与角色,即规则由谁提出、由谁执行、又主要约束谁;其五是立法状态,用以区分硬法、软法及其他治理形式;其六是技术对象,考察文本究竟针对的是泛化的“AI系统”与“AI模型”,还是更具体的前沿模型、开放权重模型等技术类别。
借助这套工具,我们可以较为直观地绘制出一张治理议题的“热力图”:哪些领域在被密集地制度化,哪些角落仍是规则的荒原。这种对文本分布的拆解,让不同维度的治理偏好一目了然。报告也因此更接近于对治理覆盖范围及其重心的测量,而不是实际成效。文本覆盖较多,并不必然意味着现实中该方向的治理已经充分到位,也可能只是因为这类议题更容易被现有制度语言吸纳。

图片来源:笔者自制
03 现有治理文本的结构性偏向
#3.1 风险失衡:技术风险站C位,社会风险遭边缘
从风险分布来看,当前AI治理文本的关注重点相当集中。报告显示,在24个风险子领域中,覆盖度较高的主要是AI系统安全漏洞与攻击、治理失败、能力与鲁棒性不足、隐私风险,以及透明度和可解释性不足;覆盖度较低的则包括AI福祉与权利、多智能体风险、经济与文化贬值、权力集中,以及环境危害。整体上看,进入治理结构中心的多是模型安全和既有监管语境中较为熟悉的问题,而处在边缘位置的,往往是社会经济影响和仍在演化中的新型风险。
#3.2周期倒挂:重“末端救火”,轻“前端设计”
从AI生命周期的分布来看,现有治理文本明显更关注系统已经进入应用之后的阶段。报告显示,在六个生命周期环节中,部署(Deploy)和运行监控(Operate and Monitor)阶段的覆盖度最高,均接近八成;相比之下,数据收集与处理(Collect and Process Data)阶段的覆盖比例明显更低,大约只有前者的一半。显然,治理关注在系统运行中呈现出显著的“后验偏好”。比起在系统构建之初布局,资源往往更倾向于向那些风险已然露头、后果清晰可见的环节倾斜。
#3.3对象模糊:迷失在“泛化AI”的宏大概念中
在技术对象层面,报告揭示了一个显著倾向: 现有的规制话语仍大量盘踞在“AI系统”或“模型”等广义范畴。相比之下, 诸如前沿AI、基础模型、开放权重以及算力门槛等更具实质影响的技术类别,在治理文本中却显得有些“失语”。这种反差表明, 尽管规则在名义上实现了宽口径覆盖,但制度视野的焦点依然停留在模糊的宏观概念,而非精准的技术颗粒。
04 偏向的生成逻辑:认知、时机与权力的三重规训
面对上述明显的结构性错位,我们很容易将其归咎于“政策滞后”或是监管者的“操作惰性”。然而,如果深入审视这些文本背后的生成逻辑,就会发现这并非偶然的疏忽,而是技术演进、认识论局限与政治经济结构共同作用的必然产物。当前治理框架之所以不断复制这种“重技术、重后端、重泛化”的偏向,主要受制于以下三种深层机制:
#4.1“政策可处理性”与对数字量化的过度倚重
为什么系统漏洞总是比权力集中更容易被写进规则?在公共政策语境中,这被称为“政策可处理性”(Policy Tractability):监管机构天然倾向于优先干预那些易于定义、测量和实施问责的领域。
人工智能的技术性风险,例如网络安全漏洞或大模型的计算浮点运算次数(FLOPs),具有高度的可量化性,监管者可以相对容易地将其转化为合规要求和基准测试。相比之下,诸如权力隐性集中、认知能力替代或民主共识侵蚀等社会性风险,表现出强烈的“奈特式不确定性”(Knightian uncertainty)与深层模糊性。在面对这些问题时,传统的精算模型宣告失效,决策者甚至无法列举出完整的“灾难性事件空间”。
这就催生了一种危险的可量化性偏见:治理框架陷入了对“数学客观性”的盲目崇拜,误以为只要模型通过了对抗性测试的量化指标,系统就是安全的。结果便是,那些具有深远破坏力、难以被精准测度的宏观社会经济风险,被系统性地排除在了硬法约束之外。
#4.2深陷“科林格里奇困境”的架构黑盒
治理重心之所以向部署后的末端倾斜,不仅是因为上游数据难以观察,更是因为规制逻辑陷入了经典的“科林格里奇困境”。
如同“代码即法律”理论所揭示的,技术底层的可规制性决定了治理的成败。现代AI大模型黑盒式的神经网络架构以及多智能体交互的不可预测性,极大地削弱了传统行政命令的效力。这就形成了一个无解的时间差:在AI生命周期的前端(设计与数据采集阶段),技术路径尚未定型,干预成本极低;但由于社会后果尚未显现,监管往往师出无名,缺乏正当的介入支点。而当危害在后端应用阶段大规模爆发时,技术已经深度嵌入了社会核心基础设施,此时再想从底层扭转轨迹,面临的经济与政治成本已极其高昂。
这种结构性的时机错位,使得现有治理往往只能在风险扩散之后被动应对,而难以在系统形成之初就建立有效约束。
#4.3权力不对称与监管俘获:巨头主导下的“安全洗绿”
治理议程从来不是在真空中设定的,偏向泛化AI的宽泛规制,其背后隐藏着技术资源的高度垄断与监管俘获。
当前开发前沿AI所需的三大核心要素——高端GPU算力、海量专有数据与顶尖人才——已高度集中在少数国家与极少数科技巨头手中。在这种极度不对称的权力结构下,政府在制定技术标准时不可避免地患上了对行业巨头的依赖症。以硅谷精英为代表的利益集团,成功将全球治理的焦点引向了长期的“存在性风险”(即防范AGI毁灭人类),这种被高度安全化的宏大叙事本质上是一种“安全洗绿”。
通过渲染极端的科幻危机,巨头们不仅成功挤占了有限的政策带宽,掩盖了迫在眉睫的算法歧视、数字血汗工厂与权力极度集中等伦理问题;更借此推动设立了动辄耗费数千万美元的算力测试与合规门槛。这些严苛的审查表面上是为了全人类的安全,客观上却构筑了极高的监管护城河,直接扼杀了中小型企业和开源社区的创新空间。这也使得原本应聚焦于社会重构的公共治理议程,被悄然置换成了大厂主导的技术合规游戏。
归根结底,目前的问题并不只是治理覆盖仍然有限,更在于治理重点的选择本身已经带有鲜明的制度倾向。文本中那些被反复书写的规则和被刻意留白的盲区,绝非无心之失,而是带有强烈的制度选择痕迹。
05
虚假的“治理饱和”与高昂的“治理代价”
沿着这种路径惯性滑行,我们首先面对的风险未必是治理的缺位,而是一场被海量合规文书掩盖的“治理饱和”错觉。规则、标准与原则不断增加,容易给人一种制度正在快速跟进的印象;但从前文所见,这些文本的覆盖本身就是不均衡的。技术性、可量化、便于问责的问题被持续纳入治理中心,结构性、长期性、分布式的风险则更容易停留在外围。文本的扩张因此并不自动等于治理视野的扩张。
进一步看,这种偏向还会带来资源配置上的自我强化。企业会优先投入那些最容易被审计、最容易转化为合规证明的环节,监管机构也会更自然地围绕已有框架配置执法与评估能力。时间一长,治理工具、组织能力与政策讨论会不断向少数议题聚集,形成一种路径依赖:越容易治理的问题,越能获得更多治理;越难进入制度语言的问题,越容易继续被推迟。
更值得警惕的是,这种失衡并不会停留在文本层面。随着AI持续嵌入金融、医疗、教育、行政等关键领域,那些在前端设计阶段未被充分处理的问题,往往会以更高成本重新出现。到那时,需要修正的往往已不只是某一项功能或某一个模型,而是整套系统的运行逻辑、风险分配方式与责任结构。治理越往后端堆积,未来纠偏的代价就越高;而某些原本可以在设计阶段被限制的风险,也会在制度迟滞中逐渐固化。
06 从“覆盖更多”到“覆盖什么”
MIT这份报告的价值远超对千余份治理文件的机械统计。它触及的是那个长期处于失声状态的核心命题:在AI治理急速扩张的进程中,我们究竟在围堵风险,还是在制度边缘制造新的盲区?报告揭示出的风险失衡、生命周期倒挂以及规制对象的模糊,清晰地勾勒出当前全球治理的结构性错位。尽管规则在累加,讨论在升温,但治理的重心与边界,始终被既有的制度语言、技术架构以及背后的权力结构深度锚定。
这昭示了一个紧迫的转向,即下一阶段我们要追问的问题,可能早已超越了单纯的治理总量,而在于“什么样的议题能够优先获得制度表达”。如果这种结构性的避重就轻得不到正视,治理的扩张将难免沦为一种昂贵的治理债务。我们可能只是在少数熟悉的议题上不断堆砌补丁,却将那些影响链条更长、处理难度更高的社会风险继续推向未来。
撰稿|陈沛羽 林成丰 王家正
排版|韩智颖
审核|智库编审委员会
