ChatGPT安全升级:可信联系人功能权威测评与使用指南
科技媒体TechCrunch于5月7日披露,OpenAI为其ChatGPT推出了一项名为“可信联系人”的新功能。这项功能旨在应对一个严肃的议题:当AI在与用户的对话中识别出涉及自我伤害的内容时,它将尝试鼓励成年用户主动联系他人,并自动向其指定的联系人发送提醒,为潜在的危机干预多提供一层沟通渠道。
这一举措的背景值得关注。此前,OpenAI曾卷入多起法律诉讼,原告方指控其ChatGPT产品鼓励了他们的亲人自杀,甚至协助制定了相关计划。这些事件无疑将AI安全,尤其是其在心理健康敏感领域的责任问题,推向了风口浪尖。
那么,OpenAI如何具体应对这类风险?目前,公司采用了一套结合自动与人工的审核机制。当用户的对话触发了系统的潜在风险警报,相关信息会被标记并转交给专门的人工安全团队进行处理。根据OpenAI的最新说明,团队力求在收到此类通知后的一小时内完乘人工复核,以平衡响应速度与判断准确性。
如果经过内部评估,判定用户确实存在严重的自残或自杀风险,ChatGPT便会启动“可信联系人”流程。系统会向用户预先设定的联系人发送电子邮件、信息或应用推送通知。这些通知信息经过精心设计,内容简短,核心目的是鼓励联系人与当事人进行沟通。值得注意的是,出于对用户隐私的严格保护,这些提醒中不会包含任何具体的对话细节或内容。


