四项核心维度居首:百度文心一言稳居国产大模型第一!
四项核心维度居首:百度文心一言稳居国产大模型第一!
最近,一份来自全球增长咨询公司弗若斯特沙利文的报告,给国内大模型领域画了张清晰的“能力地图”。《2024年中国大模型能力评测》对市面上主流的15个大模型进行了一次全面检阅。
结果不出所料,也颇有看点:百度、腾讯、阿里这些互联网大厂旗下的模型,稳稳占据了第一梯队。相比众多初创公司,它们在综合表现上确实展示出了更扎实的功底。
而更值得关注的亮点是,百度文心一言一举拿下了国产大模型综合排名的首位。细看下来,它在数理科学、语言能力、道德责任、行业能力以及综合能力这五大评测维度中,足足摘得了四项第一。
这份评测的框架设计得相当周密。它从通用基础能力和专业应用能力两大方面入手,拆解出5大核心维度以及21个细化的二级指标进行考量,可以说既有广度,也不乏深度。
放眼全球格局,一个客观事实是:国际领先的模型在通用和专业能力上,目前仍稍占优势。但令人振奋的是,文心一言在通用基础能力这一项上,已经实现了对部分国际大模型的超越。这无疑是个积极的信号。
报告最后还给出了趋势判断。沙利文预测,2024年大模型的技术演进将朝着两个方向走:一是模型本身会更“多功能”与“小型化”;二是在产业应用端,自主研发和行业标准化的呼声会越来越高。而贯穿始终、决定行业能走多远的基石,无疑是伦理责任的落实与数据标准规范的建立。这一点,已成行业共识。
