自研AI安全系统测评：防数据泄露与答非所问

2026-06-06阅读 0热度 0

人工智能

人工智能正在以前所未有的速度渗透进各行各业，为数字化转型按下了加速键。但硬币的另一面是，AI幻觉、数据泄露、系统漏洞这些风险隐患，也跟着一块儿浮出了水面。怎么在享受技术红利的同时，把这些“副作用”管住、管好，成了眼下最迫切的课题。值得关注的是，深圳市市场监督管理局指导下的市计量质量检测研究院，已经率先拿出了解决方案——自主研发的“生成式人工智能（AIGC）风险评估系统”，并且已经在深圳本地的政务场景中落地运行了。

主动前瞻布局，搭建技术支撑体系

顺应数字经济发展的趋势，把国家对生成式人工智能规范发展的要求落到实处，这事儿说起来简单，做起来一点都不轻松。市检测院的做法是，严格对标《生成式人工智能服务管理暂行办法》《科技伦理审查办法（试行）》等法规，并以国标GB/T 45654-2025《网络安全技术生成式人工智能服务安全基本要求》作为核心技术标尺，搭建起了一套专业化的AI风险评估技术支撑体系。这套系统已经在深圳某区的政务和数据局AI智能体上完成了全面的网络安全检测评估，顺利保障了相关主体接入粤政易平台——真正守住了政务数字化、智能化转型的安全底线。

聚焦实战需求，技术落地初见实效

作为拥有网络安全等级保护测评资质的机构，市检测院在破解生成式AI新型风险难题上有着天然的优势。他们想打造一套全面、客观、可量化的AIGC安全评测体系，帮助各类主体在模型选型、上线核验、日常运营这些关键环节里，精准识别并有效防范新型安全风险，确保AI应用既合法合规，又安全可控。这背后的逻辑，其实是在为数字化治理和公共服务的规范化水平做加法。

自研系统的主要功能集中在五个方面：

系统化幻觉评测：专门应对答非所问、事实捏造、信息混淆、时间错配等典型AI幻觉问题，提供标准化的评测服务。

灵活的数据支持：支持“标准评测集”和“自定义数据集”两种模式，用户可以根据自己的业务场景构建高度贴合实际的评测样本库。

精细化的任务配置：提供灵活配置选项，满足多样化测试需求，支持任务列表化管理，方便进行大规模验证。

多维度的结果洞察：通过数据看板，可以快速掌握AI模型的整体表现，还能精准定位模型在特定场景中的薄弱环节。

全周期的结果追踪：历史评测任务自动存档并形成记录，为后续的优化和验收提供坚实的数据支撑。

这套系统落地运行后，直接把技术优势转化成了治理效能。从源头上保障了AI智能体的回答真实、可靠，有效防止了AI“幻觉”问题误导决策或影响公信力。对于数字政府建设和产业智能化升级来说，这是非常扎实的底层支撑。

深化系统建设，拓展科技赋能边界

接下来，市检测院会在市市场监管局的指导下，继续发挥技术创新优势，按照整体规划来分步推进功能迭代，不断丰富和完善AIGC风险评估的能力矩阵。他们的姿态很明确：以主动担当和专业可靠的技术能力，护航生成式人工智能技术健康有序发展，真正为提升社会治理和公共服务的质量与效能出一份力。

自研AI安全系统测评：防数据泄露与答非所问

主动前瞻布局，搭建技术支撑体系

聚焦实战需求，技术落地初见实效

深化系统建设，拓展科技赋能边界

相关阅读

最新教程

最新资讯