1230 亿参数,Mistral 发布 Large 2 旗舰 AI 模型:支持 80 多种编程语言,增强代码生成、数学和推理能力

2026-05-01阅读 0热度 0
其他

AI竞赛新玩家:Mistral发布1230亿参数旗舰模型Large 2

AI领域的竞争可谓紧锣密鼓。就在Meta宣布开源Llama 3.1之后,法国人工智能的明星初创公司Mistral也迅速跟进,正式发布了其新一代旗舰模型——Mistral Large 2,为这场技术角逐增添了新的看点。

模型简介

这位新晋选手拥有1230亿个参数,与前代产品相比,在代码生成、数学和逻辑推理方面的能力得到了显著提升。不仅如此,它还带来了更强大的多语言支持与高级函数调用功能。

具体来看,Mistral Large 2配备了128K的上下文窗口,能够流畅处理包括中文在内的数十种自然语言,以及超过80种编程语言。在衡量综合知识的MMLU基准测试中,其准确率达到了84.0%。可以说,在代码、推理和多语言这几个关键战场上,它的进步有目共睹。

特别值得一提的是,Mistral此次训练的一个核心目标,就是最大程度地降低模型的“幻觉”问题。按照官方的说法,Large 2经过了针对性训练,使其回答更具辨别力。当遇到未知信息时,它会选择坦承“不知道”,而不是为了给出一个看似合理的答案而去“捏造事实”。这在当前大模型应用中,无疑是个值得关注的改进。

开放方式

那么,如何获取和使用这款强大的模型呢?根据官方新闻稿,Mistral Large 2的开放策略**侧重于“授权开放”供非商业研究用途**。这意味着研究人员可以获得模型的开放权重,并依照自己的需求进行微调,这种灵活性对于学术探索和技术迭代至关重要。

1230 亿参数,Mistral 发布 Large 2 旗舰 AI 模型:支持 80 多种编程语言,增强代码生成、数学和推理能力

当然,商业或企业用户若想将其集成到产品和服务中,则需要与Mistral公司另行商谈许可协议。这种区分研究免费、商业收费的模式,在开源生态中已是常见策略。

性能

尽管与Llama 3.1的4050亿参数规模相比,Large 2的1230亿参数显得更为精简,但其性能表现却紧紧咬住了这些顶级对手。

该模型可通过Mistral的主平台或其云合作伙伴获取。它在原有Large模型的基础上,不仅强化了多语言能力,更在推理、代码生成和数学解题等核心性能上实现了突破。

官方将其定位为“GPT-4级别”的模型。从多项基准测试结果来看,它的表现确实与GPT-4o、Llama 3.1-405B以及Anthropic的Claude 3.5 Sonnet等顶尖模型非常接近,形成了第一梯队的竞争格局。

展望未来,Mistral强调,Large 2将持续推动AI模型在**成本效益、推理速度和综合性能**三个维度上的进步。同时,通过提供高级函数调用和检索等新功能,它将帮助开发者更高效地构建出高性能的AI应用。这场围绕大模型的竞赛,看来还会更加精彩。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策