CSIS | 代理式人工智能的混淆如何危及美国治理框架
编者按
随着人工智能重塑军事与国家安全决策框架,“代理式人工智能”正成为影响战争形态与国家治理的关键变量。2026年1月26日,美国战略与国际研究中心(CSIS)发布了研究报告《迷失在定义中:对“代理式人工智能”的混淆如何危及美国治理框架》。该报告审视了业界与政府在“代理”一词定义上缺乏共识的问题,分析了这种模糊性对防务采购、系统测试与评估以及问责机制所带来的潜在风险。
报告来源
Atalan, Y., Reynolds, I., & Jensen, B. (2026) Lost in Definition: How Confusion over Agentic AI Risks Undermining U.S. Governance Frameworks. CSIS. Washington, D.C. https://www.csis.org/analysis/lost-definition-how-confusion-over-agentic-ai-risks-governance
01
核心观点
“代理式人工智能”是一个总括性术语,涵盖了从基础聊天助手到复杂自主工作流的广泛系统。据美国战略与国际研究中心(CSIS)统计,在116个国家的各类组织中,已有35%开始使用代理式人工智能系统。各国政府和军方已经在规划、后勤、情报分析和决策支持等领域对此类系统进行试验,同时私营部门对代理式技术的投资也在持续快速增长。然而,尽管该术语被广泛使用,但对于什么才算作代理式人工智能系统,目前尚无共识。
为弥补这些不足,报告建议美国政府采用一种关系性视角,将“代理性”视为技术、人员和机构之间相互作用的结果,而非纯粹的技术变量。报告强调,需要建立一个基于能力的分类体系,用以考察人工智能如何重塑组织决策、权限委托和分布式问责。通过将关注点从狭隘的技术基准转向更广泛的社会技术影响,该框架使政策制定者能够更好地使治理和采购与人机协作的实际操作情况相契合。
02
代理式人工智能的定义困境
美国的科技巨头们(Anthropic, IBM, AWS, McKinsey, Google, Deloitte, OpenAI, Mistral)为代理式人工智能定义上的不一致提供了例证。这些行业定义可以根据不同组织对AI代理概念所强调的一系列特征进行分类。
表1概述了代理式AI系统的七个关键特征:系统自主性、对大型语言模型(LLM)的需求、学习/反馈、记忆、规划/推理、协作以及感知/观察。
从表2中可以看出,只有“系统自主性”是业内共识,其他六个特征在定义上均存在不同程度的不一致。即便在“系统自主性”这一点上,行业实践中也存在相互矛盾的解释。例如,IBM和OpenAI将聊天机器人排除在代理之外。而麦肯锡则似乎暗示基于LLM的聊天机器人可以被视为代理。缺乏一致的行业定义给政府带来了采购风险,政府可能会采购到被期望执行复杂推理、但实际上只提供基础自动化的系统。
03
三种哲学视角与治理框架
此外,关于代理性和代理系统的哲学方法几十年来一直影响着人工智能研究。该报告确定了三种主要的哲学范畴:内在主义、具身/现象学主义以及关系主义。每种哲学视角都意味着不同的治理方法,决定了政策制定者将什么视为监管对象、将风险定位在哪里,以及认为哪些治理工具最具影响力。
内在主义方法将代理性视为一个封闭技术系统的特征。就系统行为而言,代理性问题因此关注模型对世界的表征,以及它如何以决定系统行动的方式将输入映射到输出。例如,内在主义框架将风险集中于模型本身,引导治理关注基准性能、鲁棒性测试和技术护栏。
具身/现象学方法则将代理性视为与环境的动态互动不可分割,强调系统通过紧密的感知-行动循环在具体情境中能够可靠地做什么。具身视角将风险集中于平台与环境的物理互动,引导治理关注安全认证、操作范围、部署规则以及场景驱动的现场测试。
而关系性方法将代理性视为由技术、人员和机构的配置之间的关系中产生的。因此,关键问题不是人工智能模型是否具有代理性,而是当系统被嵌入工作流、条令、界面设计和组织惯例时,代理性是如何产生的。关系性概念将风险集中于社会技术配置,引导治理关注采购激励、数据管理、训练管道、条令、工作流设计以及分布式问责结构。
每种视角都提供了关于代理式人工智能之“代理性”来源的不同框架,这造成了分类和评估代理式人工智能系统时的不一致标准。这种定义上的不一致延伸到了业界和美国政府/政策制定者中,导致对“代理式人工智能”的定义无法形成普遍共识。其结果是对代理式人工智能的共识流于表面且解释模糊。
据此,定义的缺失造成了三个具体的政策问题,而关系性方法正好能够解决这些问题。第一,企业定义可能因其公共普及度而影响采用规范。第二,采购实践缺乏概念基础。第三,在缺乏定义和概念一致性的情况下,治理框架面临与实际风险不匹配的威胁。关系性方法通过将治理问题从“这个系统能做什么?”转变为“这个系统如何重塑组织决策,以及在什么约束下委托了哪些权限?”来解决这些问题。
04
三项建议
该报告为美国政府提出了三项建议,旨在定义代理系统并将其纳入国家安全框架。
第一,美国政府应建立一个基于能力的、关系性的分类体系,以标准化代理式人工智能系统在国防和国家安全领域的定义与部署。该分类系统应由美国国家标准与技术研究院、国防部首席数字与人工智能办公室以及管理和预算办公室共同定义,要求每个被标记为“代理式”的系统都必须标注其具体的技术能力和组织背景。这包括记录该系统在工作流中的确切位置、被委托了哪些权限、以及人类监督设在何处,从而确保关注点从狭隘的技术特征转向对组织决策的更广泛影响。
第二,该报告建议更新采购与测试流程,强制要求供应商提供代理能力说明表,并开展组织提升研究,以衡量人工智能对决策质量和问责制的实际影响。
第三,虽然模型对齐(内在主义)和平台安全(具身)等技术评估对于建立基准仍然是必要的,但它们必须被整合到一个明确的多视角治理框架中,该框架优先考虑对制度实践的关系性影响。这种方法确保高自主性系统经过严格的基于场景的测试和红队演练,以防止人类专业能力的侵蚀,并确保形成清晰的分布式问责链。
05
中国挑战与破局
在全球层面,代理式人工智能的定义、分类标准与治理规范的制定仍处于早期阶段。目前尚无普遍公认的国际框架或政府间共识。CSIS的建议代表了美国国内为建立一个更具结构性、基于能力的 框架所做的早期努力,其形成受到国防与国家安全等国内制度需求的驱动。尽管围绕协调盟友与伙伴之间方法的问题出现了一些讨论,但这些努力在范围上仍然有限,尚未构成全球标准。
对中国而言,代理式人工智能缺乏统一定义,给其参与这一不断演变的全球讨论带来了具体挑战。一方面,如果没有一个连贯一致的概念框架,我国在参与国际讨论和多边协调中清晰地阐述自身的治理原则会落入劣势,例如场景化监管、技术包容性以及以人为中心的监督。另一方面,国内术语的碎片化增加了中国人工智能企业将其研发和产品标准与多样化且不断变化的外部框架对接的成本,可能使国际合作与市场拓展复杂化。
但这种情况带来的更多是机遇而非制约。制定一个统一定义—明确自主性、权限委托、工作流定位与问责等关键维度—将有助于解决国内挑战,包括跨部门协调效率低下以及采购与评估中的不一致问题,促使我国能够在全球讨论中阐述一个更清晰、更系统的治理框架,从而更主动的参与代理式人工智能治理的规则塑造。
撰写|林成丰
排版|余沁兰
审核|陆逸沛
