文心大模型5.1深度测评：搜索能力国内领先，预训练成本大幅降低

2026-05-11阅读 0热度 0

文心大模型

百度正式推出其新一代基础大模型——文心大模型5.1。目前，该模型已在百度千帆模型广场与文心一言平台同步开放，供企业用户与开发者接入体验。

本次迭代的核心突破在于其“高性价比”优势。百度官方披露，文心5.1应用了“多维弹性预训练”技术。该技术的关键在于，仅消耗了行业同规模模型约6%的预训练成本，便实现了基础性能的领先。这一成果直观体现在国际权威评测平台LMArena的搜索能力榜单上——文心5.1以1223分的成绩位居国内第一、全球第四，是该榜单中唯一的国产模型。

“多维弹性预训练”是一项能够通过单次训练产出多种规模模型的技术。它最初于文心5.0版本中提出，而5.1版本则是该技术路线下的一个关键里程碑。凭借此项技术，文心5.1在完整继承前代知识体系的基础上，成功将模型总参数压缩至约三分之一，激活参数压缩至约二分之一。正是这种“精简架构”与“提升效能”并行的策略，达成了以极低成本实现性能突破的目标。

除搜索能力外，文心5.1的综合性能同样值得关注。百度表示，在多项行业权威基准测试中，该模型均展现出强劲实力。其中，其智能体（Agent）能力显著提升，已超越DeepSeek-V4-Pro；创意写作能力与Gemini 3.1 Pro表现相当；而在复杂推理任务上，也已逼近业界领先的闭源模型水平。

需要明确的是，榜单所指的“搜索能力”并非传统网页搜索，而是指大模型对多源信息的快速检索、整合与生成能力。具备强大搜索能力的模型，其输出结果通常具备更高的一致性与可信度。这意味着，在内容创作、智能助手、企业知识库管理以及复杂的智能体应用等场景中，此类模型能够更高效地充当信息处理核心，其应用前景也更为广泛。

事实上，文心大模型系列在LMArena榜单上的表现一贯稳健。此前，文心5.0系列就曾多次登上该平台的文本理解与视觉理解榜单，稳居国产模型领先阵营。更早之前，在4月30日，文心5.1的预览版本曾以1476分登上LMArena文本榜国内榜首，超越了GPT-5.5、DeepSeek-V4-Pro等多款国内外主流模型，是当时榜单前十五名中唯一的国产模型。

LMArena平台的评测机制也增强了其排名的参考价值。该榜单基于全球用户的真实使用数据进行盲测对比，其Elo评分完全由用户投票直接生成，因此在业内被普遍认为具有较高的客观性与公信力。

随着文心5.1的发布，行业焦点也转向即将召开的百度年度AI盛会。据悉，Create 2026百度AI开发者大会将于5月13日至14日在北京国家会议中心二期举行，百度创始人李彦宏将出席并发表主题演讲。届时，百度有望进一步公布文心大模型5.1的更多技术细节与商业化部署策略，值得业界密切关注。

文心大模型5.1深度测评：搜索能力国内领先，预训练成本大幅降低

相关阅读

最新教程

最新资讯