最新模型治理对比:中美欧差异与共识深度分析
从算法到模型,人工智能正跨越一个分水岭——过去我们依赖既定规则来定义智能,如今它开始自我学习、自我进化。同步而来的,是一个全新的治理命题:创新不能停,安全也不可放,怎么平衡?近期的三个节点给出了不同答案。2025年7月,欧盟发布了自愿性指导文件《通用人工智能实践准则》,旨在帮模型提供者履行《人工智能法案》中通用模型的相关义务。[1] 9月,美国加州州长签署《前沿人工智能透明法案》(SB 53),聚焦“前沿模型”的透明度义务。[2] 同月,中国发布《人工智能安全治理框架2.0》,虽非专门针对模型,但明确了模型层面的风险与应对指引。[3]
如何治理模型:欧盟、美国加州与中国的探索
这三个主要经济体在模型治理上走出了三条截然不同的路:欧盟喜欢层层叠叠的风险类别配上高密度的义务;加州选择小范围、轻监管,突出企业自律;中国则从应用场景切入,自下而上延伸到模型本身。理解这些差异与共性,有助于看清模型治理在整个人工智能治理版图中的枢纽位置。
欧盟:多层风险判断,义务复杂繁多
欧盟原计划围绕AI系统搭建风险治理框架,就是大家熟悉的“禁止类、高风险、有限风险、最小风险”四级——风险越高,监管越严。但ChatGPT 3.5的横空出世彻底打乱了立法节奏[4],2023年欧盟在最后阶段匆忙把通用模型条款塞了进去[5]。于是,在原有四级风险框架之外,又平行构建了一套针对模型的治理机制:所有通用模型提供者都得披露技术文档、训练摘要、制定版权政策(没有系统性风险的可以豁免部分义务);如果模型具有系统性风险,还得进行模型评估、采取缓解措施、报告重大事件等。
麻烦在于如何界定“系统性风险”。欧盟结合《AI法案》和《实践准则》,既依赖理念性标准(“高影响能力”),又用技术量化指标(训练计算量超过1025 FLOPs),甚至连应用端的风险源头——分发策略、用户数量、模型误用——也纳入考量,最终形成了一套多层、复杂的风险判断架构。
义务方面,许多要求其实超出了模型提供者对模型自身的控制范围。比如《实践准则》中“安全保障”义务已被实质扩展到应用场景——要求“构建未来风险情景”(措施2.2)和“收集最终用户反馈”(措施3.5)。模型提供者的角色偏向“能力模块提供”,通常不决定实际用途,但承担的风险管理、技术可靠性等义务,却和针对特定用途的高风险系统提供者十分接近。
整体看,欧盟框架有两个特征:一是模型与应用两套标准交叉重叠,理论上精密,实践上却很笨重;二是模型风险与应用风险混在一起,把对部署者的期望写进了对提供者的准则里,让提供者承担“无法预见、评估或减轻”的风险责任。这徒增了文书负担,也在拖累创新。所以欧盟委员会现在正推动“数字 Omnibus”一揽子简化方案,对《AI法案》等法规进行简化修订,试图削减监管负担。[7]
美国加州:收窄监管范围,设置轻量化义务
美国联邦层面的AI立法还在讨论,但科技重镇加州已经先行一步。2024年加州议会提出《安全与创新前沿人工智能模型法案》(SB 1047),因为监管范围太广可能抑制创新,最终被否决。随后新版《前沿人工智能透明度法案》(SB 53)大幅收敛,最终签署通过。相比SB 1047,SB 53以产业自律为核心,删去了强制安全协议等争议条款,透明度报告所需的信息也大幅简化。[9]
SB 53有两个显著特点。一是监管对象起点更高、范围更窄。欧盟针对所有通用模型提供者,而SB 53只限定于“前沿开发者”——即训练或启动训练使用超过1026 FLOPs的基础模型的主体;对于更高一层的“大型前沿开发者”,范围更窄,额外要求在上一日历年总收入超过5亿美元,“当前仅覆盖寥寥几款全球最强大的模型”[10]。二是义务极其限缩、轻量。透明度报告只涉及网站、沟通机制、预期用途等基础信息;相比之下,欧盟的“技术文档”义务延伸到了“模型和训练过程的设计规范”“用于训练、测试和验证的数据信息”等细节,信息披露全面度、颗粒度极高。而大型前沿开发者额外承担的发布“前沿AI框架”、开展灾难性风险评估、向州应急服务办公室提交摘要报告等义务,实质上并没有超出目前头部大模型公司在安全治理上的常规做法。
一句话概括,SB 53的“小切口、轻义务”治理逻辑,和加州一向的AI立法思路一脉相承。过去三年加州出台了多项AI法规,但多针对具体而微的细分场景——比如《伴侣聊天机器人法案》(SB 243)只适用于伴侣聊天机器人,《关于人工智能在医疗专业用语中的误用法案》(AB 489)专门禁止AI冒用医师资质进行医疗建议,义务也多为轻量化的透明度。可见加州的立法主线依旧是促进产业发展、增强竞争力,避免给产业套上过多锁链。
中国:务实导向,基于应用服务的模型治理
中国的治理并没有直接指向模型本身,而是以实际应用服务为切入点,通过深入规制应用,自下而上地实现了对模型的延伸治理。
立法层面,中国立足现实问题,以算法治理为起点,逐步形成对模型的制度约束。早在“通用模型”成为热点之前,中国就通过“算法治理”为模型治理打下了基础。2021年《互联网信息服务算法推荐管理规定》将生成合成类算法推荐服务提供者纳入规制,要求建立健全算法机制审核、备案与安全评估等制度。2022年《互联网信息服务深度合成管理规定》从“算法推荐”转向“深度合成技术”,回应深度伪造带来的风险,实质上提前切中了模型最核心的“生成合成”能力领域。2023年《生成式人工智能服务管理暂行办法》立足AI服务提供者,但治理要求从应用延伸至模型层,对数据治理、内容生成等提出规范,通过安全评估、模型备案等抓手间接规制模型。2025年《人工智能生成合成内容标识办法》同样以服务为切口,要求显式或隐式标识。
软法层面,治理深度更进一步,明确提出了模型层的风险识别与应对措施。从《网络安全技术 生成式人工智能服务安全基本要求(TC260-003)》到《人工智能安全治理框架1.0》及其2.0版本,中国在风险识别上提供了区别于欧美的务实路径:采用“内生风险—应用风险—衍生风险”的三层结构,清晰勾勒了人工智能安全风险的轮廓。其中,“模型算法风险”归入“内生风险”,主要指可解释性不足、鲁棒性不强等。通过明确风险边界,框架避免了将应用环节的风险误归于模型本身,使风险归因更符合技术与应用的边界——对模型来说,它所能控制且最具危害传导性的,正是自身的内生风险。
总体看,中国模型治理始终以现实问题为导向,从应用服务入手延伸至模型层,通过实用有效的抓手,形成系统完善的治理机制。
以共识为起点,探索更可行的模型治理方案
尽管中美欧在模型治理的背景、对象与义务设定上差异明显,但仍有重要的共性特征值得关注。
第一,总体思路都表现出“柔性治理、产业先行”的制度倾向。欧盟《实践准则》属于自愿性承诺,立法过程中删去了“关键绩效指标”等硬性义务,给企业留出自主合规空间。美国加州SB 53更为宽松,仅以透明度为切口,由企业自律主导。中国同样以产业中的现实问题为导向,从应用端切入,强调实践驱动与问题响应,依托指导性文件、技术标准和评估机制推进治理,并在产业发展过程中不断完善规则。
第二,风险评估层面,面对当前模型能力的不确定性和制度上难以形成统一基线的现实,各方把“构建评估生态”视为更可行的路径。欧盟《实践准则》建议建立社区驱动的模型评估榜单;美国SB 53要求在“前沿AI框架”中纳入委托第三方开展灾难性风险评估的安排;中国《人工智能安全治理框架2.0》也在内生风险的“综合治理措施”中提出“建立人工智能安全测评体系”的目标。可以说,三方都在探索通过开放、多元的社会评估机制,弥合制度能力与技术演进之间的差距。正如开源社区里那句老话:“足够多的眼睛,可以让所有问题浮现。”
第三,模型治理工具的选择上,透明度因其技术中立、操作性强,已经成为核心手段。在模型风险机理仍待认知与验证的阶段,透明度以最小约束实现最大可控性,同时为创新留出空间。欧盟依披露对象采取横向分级路径,分别面向AI办公室、国家主管机关与下游主体设置信息披露层级;加州则按开发者规模采取纵向分级,区分前沿模型与大型前沿模型开发者,设置强度有别的义务,并统一向公众披露。中国在透明度建设上走在前列,从算法推荐到深度合成,再到大模型备案,信息公示与算法备案机制逐步完善,模型功能、安全评估环节已经实现了较高程度的可见性。
最后值得一提的是,中美在模型治理路径上还有一个共通特点:从具体应用场景出发。相比欧盟自上而下的“预设式”治理,这一路径有助于厘清模型风险与应用风险的边界,避免把应用风险误归于模型本身,让模型提供者可以聚焦于自己可控的内生风险,开展更有针对性的治理。这种审慎务实的做法,优势在于把治理建立在对风险的真实、具体认知之上——用一句业界常说的话:“只有通过技术扩散,才能真正识别其效用或缺陷;有了这些具体的经验,才能针对具体薄弱环节制定规则。”[11]
