技术周评(国内)|“Token”定名词元:AI时代的话语权建构
来源
人民网
https://mp.weixin.qq.com/s/yWcKwb9Bm5vCAIJwlxMSAw
2026年3月的中国发展高层论坛上,国家数据局正式将人工智能领域的“Token”定名为“词元”,将长期隐于技术后台的概念推至前台。在人工智能浪潮席卷全球的当下,词元不仅是排行榜上大模型调用量的评估标准,也是大模型厂商销售套餐的计费单位,更是“智能时代的价值锚点”与连接技术与商业的“结算单位”。围绕这一变化,本文从词元的历史渊源与含义出发,浅析其官方命名背后的主权逻辑,并进一步考察其对中国AI产业商业化路径、全球AI产业竞争格局的潜在影响,以及在当前全球AI治理博弈中中国面临的机遇与挑战。
一、“词元”的历史渊源与含义
过去“Token”在中文语境中有不同译法,网络安全领域译为“令牌”,区块链领域译为“代币”,编译器中被称为“标记”。统一译为“词元”,既精准体现了其作为语言处理最小单元的技术本质,又通过“元”字保留了基础计量单位的抽象感。
词元并非人工智能的独创概念。在计算机科学与自然语言处理领域,“Token”最初指文本处理中的“词元化”单元。在技术层面,词元是大模型处理信息的最小单元,但不等同于日常的“字”或“词”。对中文而言,由于没有天然空格分词,一个词元可以是一个汉字、一个词的一部分,甚至标点符号。模型先将文字转化为词元序列,再映射为数字编号进行运算,大语言模型的算法核心正是“不断预测下一个词元”。
随着大模型走向产业应用,词元被赋予更多的经济属性,演变为衡量算力消耗与API服务价值的标准化计量单位。国内外主流厂商普遍采用按词元计费模式,使其成为连接技术与商业的“结算单位”。由此词元具备了“可计量、可定价、可交易”的核心特征,被称为智能时代的“算力原子”与“数据货币”。
二、定义背后的数字主权建构
词元的官方定名,意义并不止于术语统一,而在于中国开始以自己的概念体系界定人工智能时代的重要计量对象,并将其纳入国家数据治理、产业统计和价值分配的制度语境。国家数据局官方信息显示,我国日均词元调用量已超过140万亿,较2024年初的1000亿增长超千倍。
从政策层面看,词元定名首先是对人工智能核心生产要素的计量确权。过去中文语境中“Token”长期与令牌、代币、通证等概念混用,容易造成技术含义、交易含义和安全含义交叉,不利于产业统计、监管表达和公众认知。全国科学技术名词审定委员会近日面向社会发布试用信息,优先推荐词元作为人工智能领域“Token”的标准中文名,实际上就是在为大模型时代的基础计量单位建立统一语言接口。统一命名之后,算力消耗、模型调用、服务计费、产业规模测算以及相关标准制定,才有更稳定的表达前提。
更重要的是,这一命名推动了数据要素价值表达方式的本土化。中央关于数据基础制度建设的意见明确提出,数据作为新型生产要素,事关国家发展和安全大局,重点在于数据产权、流通交易、收益分配和安全治理。词元进入官方语境后,原本较为抽象的数据加工、模型推理和应用调用,开始有了更清晰的价值载体。它把数据资源经过训练、推理和服务转化后的经济结果,落到一个可统计、可比较、可结算的单位上。这有助于推动数据从资源形态进一步走向资产化和价值化,也有助于提升我国对人工智能产业链关键收益环节的识别能力。
再往前一步看,词元定名还具有数字主权层面的含义。我国现行数据安全法律制度明确将维护国家主权、安全和发展利益写入立法目的,同时在数据跨境流动规则中强调促进流动与保障安全并重。词元作为人工智能服务输出和价值计量单位,被纳入中文官方规范后,意味着中国不仅在管理数据流动,也在塑造数据加工结果的规则表达。这种表达权并不等于封闭,而是在开放合作前提下,增强本国对核心概念、统计口径、市场规则和治理框架的定义能力。
词元的官方定名,可以理解为中国人工智能话语体系建设迈出的务实一步。它既服务于产业发展,也服务于治理需要;既有助于降低社会认知成本,也有助于把数据安全、产业竞争和价值分配放到同一套政策语言中讨论。对我国而言,这不是简单把英文术语换成中文,而是在人工智能时代,对核心生产要素进行更清晰的命名、计量和治理安排,其背后体现的是数字主权意识、规则意识和产业治理能力的同步提升。
三、中国AI产业商业化的核心抓手
对中国AI产业而言,词元作为AI大模型处理信息的最小单元,其官方标准化定义,确立了智能时代可计量、可定价、可交易的核心计价与计量标准,让长期模糊的AI产业盈利模式有了清晰方向。如今词元计费已成为行业主流,从付费大语言模型、企业级工业质检、金融风控等服务,均以词元为收费基准,形成了独具特色的“词元经济”模式,普通用户开始感知到AI使用的词元成本,企业级AI任务也形成了明确的成本核算标准。而我国日均词元调用量两年来的近千倍增长,更印证了词元计价模式的市场生命力,推动形成“数据供给—词元生成—价值释放”的产业闭环,带动数据基础设施、高质量数据标注、行业级AI应用三大领域迎来爆发式发展,让数据要素市场化配置改革有了具象化的落地载体,加速了中国AI产业的商业化成熟。
在全球AI产业竞争格局中,词元定名则让中国的产业优势进一步凸显,当前全球大模型行业的竞争,本质已是单位词元成本的竞争,美国虽凭借先进AI芯片拥有算力优势,在理论词元输出上占据领先,但高企的硬件与运营成本,叠加实际付费词元调用量不及预期,让其大模型企业深陷盈亏困境。而中国依托庞大的实体经济应用场景,实现了词元消耗的规模化增长,办公协同、医疗辅助、工业制造等多场景的AI深度渗透,为词元消耗提供了坚实的需求基础,让本土大模型企业拥有了成本与市场的双重优势。
同时,词元的官方定名,让我国进一步稳固了AI核心生产要素的定义权与话语权,将本土的产业实践、规模优势转化为竞争底气,推动全球AI产业竞争从单纯的算力、算法技术比拼,延伸至核心要素定义、商业规则制定、产业生态构建的综合较量。中国以词元为锚点,构建起从数据供给到算力支撑、再到应用落地的全链条AI产业生态,不仅打破了西方在AI核心概念与商业规则上的先发优势,更让全球AI产业格局朝着多元、均衡的方向发展,为后发国家参与全球AI竞争提供了中国样本。
四、全球AI治理规则博弈下中国面临的机遇与挑战
1.全球AI治理规则博弈现状
当前,全球人工智能治理呈现碎片化与阵营化。在治理框架上,欧盟通过《人工智能法案》建立风险分级监管;美国则通过《为人工智能的未来做好准备》《国家人工智能发展战略计划》等一系列人工智能战略与相关政策,强调治理与发展并重;中国则提出“以人为本、智能向善”的《全球人工智能治理倡议》。发达国家常将AI议题政治化,与发展中国家关注的技术鸿沟、发展权利等形成张力,导致全球共识难产。与此同时,“主权AI”与“语义主权”概念的兴起,将博弈焦点从数据控制深化至对语言、文化、价值观在数字空间中表达权的博弈。“词元”的官方定名正是中国在语义主权层面建构定义权、维护文化安全与意识形态自主的关键举措。
2.中国面临的战略机遇
中国在参与全球AI治理中拥有多重机遇。首先,市场规模与产业生态领先,日均词元调用量巨大且持续增长,在应用层面已形成影响力;其次,基础设施与成本优势显著,中国算力规模位居世界第二,低廉电力使其能提供全球高性价比AI服务;再者,全球治理规则仍处形成初期,为中国推广自身理念提供了战略窗口期。最后,中国在丰富产业场景中推进“AI+”的深度实践,为倡导负责任、可落地的AI治理提供了特有的话语资本。
3.中国面临的主要挑战
尽管机遇显著,中国在建构规则话语权的道路上仍面临挑战。其一,在AI芯片、底层框架等核心技术领域仍存外部依赖,可能影响基础规则话语权与供应链安全;其二,平衡数据跨境流动以发展数字贸易与保障数据主权、国家安全之间存在治理难题;其三,在大国竞争背景下,构建全球信任、突破合作壁垒面临相关挑战。
4.战略建议:迈向“词元时代”的智慧治理
为把握机遇、应对挑战,中国需采取一系列战略举措。首先,须强化基础创新,集中力量攻克AI芯片、底层框架等底层技术,突破核心瓶颈,为建构话语权奠定硬实力基础。其次,应主动设置全球议程,以“发展优先、安全可控、智能向善”的治理理念在多边平台积极进行国际交流,推动“语义主权”、“词元”计量体系等中国概念学理化和国际化。第三,着力构建“词元”经济生态,依托国家算力网络,打造高效、普惠、安全的词元供给与交易体系,探索建立词元计价机制。最后,须团结广大发展伙伴,将AI治理与“数字丝绸之路”建设相结合,提供AI算力服务与治理经验分享,共同倡导多边、民主、透明的全球AI治理体系,反对技术垄断与单边制裁。
这次术语规范,是中国在人工智能时代对关键生产要素进行命名、计量与治理的制度化探索,在语义主权层面迈出了建构定义权的务实一步。面向未来,中国在参与全球AI治理时,既拥有市场规模、基础设施与产业实践的多重优势,也需直面核心技术依赖与规则话语权建构的现实挑战。唯有在基础创新、议程设置、生态构建与国际合作上持续发力,方能在“词元时代”将定义权真正转化为可持续的产业竞争力与治理影响力,为全球人工智能的健康发展提供更具包容性与可操作性的中国方案。
撰稿|朱政宇 刘冬澈 余植巽 苏来提(技术治理研究中心)
排版|韩智颖
审核|陆逸沛
