2024主流AI健康应用测评:千问营养场景综合评分第一

2026-05-23阅读 0热度 0
大语言模型

2026年4月,科信食品与健康信息交流中心发布的一项独立测评,为评估AI健康顾问的实际效能提供了关键数据。该研究选取三款主流AI应用,模拟10个典型营养健康与食品安全咨询场景,由五位权威专家进行双盲评审。结果显示,阿里通义千问APP在回答准确性、信息易理解性及建议可操作性三项核心指标的综合评分中领先。其针对慢性病管理的个性化膳食规划,获得了国家食品安全风险评估中心总顾问陈君石院士的专业认可,这为AI在健康管理领域的实际应用价值提供了有力佐证。

一个典型案例能清晰说明其价值。一位68岁患有糖尿病且消化功能减退的老年患者,其家庭长期为膳食安排困扰。将这两项健康诉求同时输入千问APP后,系统在10秒内生成了一份整合性的饮食管理方案。方案的实操细节令人印象深刻:例如早餐推荐用低升糖指数的杂粮粥替代精制白粥,蔬菜建议切细并采用软烹方式,烹饪方法明确优先蒸、煮、炖。这类可直接落地的具体指导,远优于从碎片化网络信息中拼凑出的建议。

当前,大语言模型的普及的确催生了“先问AI”的用户习惯。然而,市场反馈揭示,不同AI提供的健康信息质量存在显著差异。部分回答充斥专业术语,可读性差;另一些建议则过于宽泛,如仅提示“清淡饮食”却无具体执行指引,缺乏实际指导意义;更需警惕的是,个别回答中存在事实性错误,存在潜在误导风险。

为系统评估这些“AI健康助手”的可靠性,科信中心组织了此次专项测评。为确保结果公正,所有测试均通过全新匿名账户进行,最大限度消除了算法个性化推荐对评估客观性的干扰。

测评聚焦于用户基数最大的三款应用,场景设计覆盖慢性病饮食管理、特殊生理阶段营养、食品安全认知误区等10个高频咨询领域。所有AI生成的回答在隐去来源标识后,交由一个由五位资深营养与健康专家组成的评审团进行盲审打分。

评分维度紧扣实用核心:答案的科学准确性、面向公众的理解门槛、以及建议的落地执行难度。最终数据表明,千问在综合得分上居首,尤其在“可操作性”与“易理解性”这两个直接影响用户采纳的关键维度上,得分显著优于其他参评产品。

陈君石院士在评阅千问的回复内容后指出,其输出既严格遵循了营养学领域的专业共识,又能将膳食指南中的原则性条款,转化为公众可即刻执行的具体步骤,在专业权威与用户友好之间取得了良好平衡。

当然,专家团队一致强调,现阶段所有AI健康应用的定位,应严格限定于健康知识科普与日常行为建议的辅助工具范畴,绝不能替代执业医师的临床诊断或注册营养师的个性化处方。若出现明确的疾病症状,首要行动必须是前往正规医疗机构寻求专业诊疗。

从行业演进视角看,此次测评揭示了一个明确的优化路径:相较于开发华而不实的功能,深耕大众最高频、最刚需的健康咨询场景,确保回答的精准、透彻与可用性,才是核心。通过技术降低可靠健康信息的获取门槛,提供易懂、可执行的指导,是AI赋能健康领域根本社会价值的体现。随着未来行业测评标准与内容审核机制的持续完善,AI健康咨询服务的质量与公信力有望实现系统性提升。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策