1230 亿参数,Mistral 发布 Large 2 旗舰 AI 模型:支持 80 多种编程语言,增强代码生成、数学和推理能力
AI竞赛新玩家:Mistral发布1230亿参数旗舰模型Large 2
AI领域的竞争可谓紧锣密鼓。就在Meta宣布开源Llama 3.1之后,法国人工智能的明星初创公司Mistral也迅速跟进,正式发布了其新一代旗舰模型——Mistral Large 2,为这场技术角逐增添了新的看点。
模型简介
这位新晋选手拥有1230亿个参数,与前代产品相比,在代码生成、数学和逻辑推理方面的能力得到了显著提升。不仅如此,它还带来了更强大的多语言支持与高级函数调用功能。
具体来看,Mistral Large 2配备了128K的上下文窗口,能够流畅处理包括中文在内的数十种自然语言,以及超过80种编程语言。在衡量综合知识的MMLU基准测试中,其准确率达到了84.0%。可以说,在代码、推理和多语言这几个关键战场上,它的进步有目共睹。
特别值得一提的是,Mistral此次训练的一个核心目标,就是最大程度地降低模型的“幻觉”问题。按照官方的说法,Large 2经过了针对性训练,使其回答更具辨别力。当遇到未知信息时,它会选择坦承“不知道”,而不是为了给出一个看似合理的答案而去“捏造事实”。这在当前大模型应用中,无疑是个值得关注的改进。
开放方式
那么,如何获取和使用这款强大的模型呢?根据官方新闻稿,Mistral Large 2的开放策略**侧重于“授权开放”供非商业研究用途**。这意味着研究人员可以获得模型的开放权重,并依照自己的需求进行微调,这种灵活性对于学术探索和技术迭代至关重要。
当然,商业或企业用户若想将其集成到产品和服务中,则需要与Mistral公司另行商谈许可协议。这种区分研究免费、商业收费的模式,在开源生态中已是常见策略。
性能
尽管与Llama 3.1的4050亿参数规模相比,Large 2的1230亿参数显得更为精简,但其性能表现却紧紧咬住了这些顶级对手。
该模型可通过Mistral的主平台或其云合作伙伴获取。它在原有Large模型的基础上,不仅强化了多语言能力,更在推理、代码生成和数学解题等核心性能上实现了突破。
官方将其定位为“GPT-4级别”的模型。从多项基准测试结果来看,它的表现确实与GPT-4o、Llama 3.1-405B以及Anthropic的Claude 3.5 Sonnet等顶尖模型非常接近,形成了第一梯队的竞争格局。
展望未来,Mistral强调,Large 2将持续推动AI模型在**成本效益、推理速度和综合性能**三个维度上的进步。同时,通过提供高级函数调用和检索等新功能,它将帮助开发者更高效地构建出高性能的AI应用。这场围绕大模型的竞赛,看来还会更加精彩。
