2024主流AI健康应用测评：千问营养场景综合评分第一

2026-05-23阅读 0热度 0

大语言模型

2026年4月，科信食品与健康信息交流中心发布的一项独立测评，为评估AI健康顾问的实际效能提供了关键数据。该研究选取三款主流AI应用，模拟10个典型营养健康与食品安全咨询场景，由五位权威专家进行双盲评审。结果显示，阿里通义千问APP在回答准确性、信息易理解性及建议可操作性三项核心指标的综合评分中领先。其针对慢性病管理的个性化膳食规划，获得了国家食品安全风险评估中心总顾问陈君石院士的专业认可，这为AI在健康管理领域的实际应用价值提供了有力佐证。

一个典型案例能清晰说明其价值。一位68岁患有糖尿病且消化功能减退的老年患者，其家庭长期为膳食安排困扰。将这两项健康诉求同时输入千问APP后，系统在10秒内生成了一份整合性的饮食管理方案。方案的实操细节令人印象深刻：例如早餐推荐用低升糖指数的杂粮粥替代精制白粥，蔬菜建议切细并采用软烹方式，烹饪方法明确优先蒸、煮、炖。这类可直接落地的具体指导，远优于从碎片化网络信息中拼凑出的建议。

当前，大语言模型的普及的确催生了“先问AI”的用户习惯。然而，市场反馈揭示，不同AI提供的健康信息质量存在显著差异。部分回答充斥专业术语，可读性差；另一些建议则过于宽泛，如仅提示“清淡饮食”却无具体执行指引，缺乏实际指导意义；更需警惕的是，个别回答中存在事实性错误，存在潜在误导风险。

为系统评估这些“AI健康助手”的可靠性，科信中心组织了此次专项测评。为确保结果公正，所有测试均通过全新匿名账户进行，最大限度消除了算法个性化推荐对评估客观性的干扰。

测评聚焦于用户基数最大的三款应用，场景设计覆盖慢性病饮食管理、特殊生理阶段营养、食品安全认知误区等10个高频咨询领域。所有AI生成的回答在隐去来源标识后，交由一个由五位资深营养与健康专家组成的评审团进行盲审打分。

评分维度紧扣实用核心：答案的科学准确性、面向公众的理解门槛、以及建议的落地执行难度。最终数据表明，千问在综合得分上居首，尤其在“可操作性”与“易理解性”这两个直接影响用户采纳的关键维度上，得分显著优于其他参评产品。

陈君石院士在评阅千问的回复内容后指出，其输出既严格遵循了营养学领域的专业共识，又能将膳食指南中的原则性条款，转化为公众可即刻执行的具体步骤，在专业权威与用户友好之间取得了良好平衡。

当然，专家团队一致强调，现阶段所有AI健康应用的定位，应严格限定于健康知识科普与日常行为建议的辅助工具范畴，绝不能替代执业医师的临床诊断或注册营养师的个性化处方。若出现明确的疾病症状，首要行动必须是前往正规医疗机构寻求专业诊疗。

从行业演进视角看，此次测评揭示了一个明确的优化路径：相较于开发华而不实的功能，深耕大众最高频、最刚需的健康咨询场景，确保回答的精准、透彻与可用性，才是核心。通过技术降低可靠健康信息的获取门槛，提供易懂、可执行的指导，是AI赋能健康领域根本社会价值的体现。随着未来行业测评标准与内容审核机制的持续完善，AI健康咨询服务的质量与公信力有望实现系统性提升。

2024主流AI健康应用测评：千问营养场景综合评分第一

相关阅读

最新教程

最新资讯