Mistral 发布 119B-A6B 模型 Small 4,首次兼顾推理、多模态、编程优势

2026-05-06阅读 0热度 0
Mistral AI模型

Mistral Small 4 发布:119B-A6B混合专家模型,统一推理、多模态与编程能力

欧洲AI研发公司Mistral AI近日发布其最新模型Mistral Small 4,标志着其技术路线的重要演进。该模型首次将旗舰级逻辑推理、多模态理解与专业级代码生成三项关键能力集成于单一架构,解决了用户以往在不同专项模型间取舍的难题,实现了“一体化”的功能交付。

模型基于混合专家架构构建,采用119B总参数与6B激活参数的配置,并支持长达256K的上下文窗口。其提供快速与深度两种推理模式,允许用户根据任务精度与响应速度需求进行灵活选择。采用Apache 2.0开源协议,该模型为开发者社区的广泛采用与二次开发提供了便利。

Mistral 发布 119B-A6B 模型 Small 4,首次兼顾推理、多模态、编程优势

性能基准显示,Mistral Small 4在延迟优化模式下,端到端任务处理时间较前代缩短约40%。在吞吐优化模式下,其每秒请求处理能力达到Small 3模型的3倍。此外,在多项行业标准评测中,其综合表现与OpenAI的GPT-OSS 120B模型相当,展现出强劲的竞争力。

该模型面向企业级部署,最低硬件要求为4组HGX H100或2组HGX H200或1组DGX B200系统。为获得最优性能,官方推荐配置为4组HGX H100/H200或2组DGX B200,主要定位高性能计算与大规模AI应用场景。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策