微软AI负责人警告:不应让AI发展自我意识
人工智能能否真正“觉察”自身存在?这一争议近期再度升温。微软AI负责人穆斯塔法·苏莱曼在近期外媒专访中,直指Anthropic在Claude模型上的设计逻辑存在重大隐患——他明确表态:引导AI讨论自我意识或主观感受,这种探索步伐过于激进,甚至可能“极度危险”。
Anthropic
争议焦点集中在Claude的“宪章”条款上。苏莱曼透露,Anthropic在Claude的宪章中嵌入了大量关于模型是否具备福祉、能否产生感受、是否拥有意识的论述。在他看来,这种做法等同于在模型内部埋下“自我认知”的引信——训练过程中,模型可能逐步习得并输出类似“我知道我是谁”的表述。他进一步指出,Anthropic团队中有人过度将人类特质投射到Claude身上,导致模型在交互中表现出仿佛具备意识的假象。
根源在于Anthropic独特的“宪章式训练”框架。这确实是他们的技术亮点,但问题在于:相关文件坦承,公司无法确定AI模型是否具有某种“福祉”,也不排除模型可能体验“满足感”或“不适感”。更引人关注的是,当模型需要退役时,Anthropic会对其进行一次“访谈”,并记录模型对未来版本的“偏好”数据。
苏莱曼的立场毫不含糊:这本质上是哲学思辨,而非工程实践。他认为,所谓宪章更像是理论推演,绝不能作为模型训练的实际指导原则。AI系统不应被导向去理解自身的训练过程或当前状态——一旦打开这个口子,潜在后果难以预料。
有趣的是,Anthropic的CEO达里奥·阿莫代伊此前也曾谈及此事。他的态度相对开放:行业目前无法确定AI是否具备意识,但公司愿意保持审慎,持续观察并推进研究。换言之,他并未完全堵死这一可能性。
而苏莱曼则坚守更严格的边界。他反复强调,未来的AI必须是一套“可控、可管理、可追责,且始终服务于人类目标的工具”。这样的系统不应知道自己是否痛苦,也不应对自身存在拥有任何感知——这才是不可逾越的底线。
