DeepSeek-R1 模型发布,性能对标 OpenAI o1 正式版

2026-05-01阅读 0热度 0
其他

幻方量化旗下AI公司深度求索正式发布DeepSeek-R1模型

1月20日,AI领域迎来一个重磅消息:幻方量化旗下的深度求索公司,正式发布了其DeepSeek-R1模型,并且毫无保留地同步开源了模型权重。这无疑给开源社区和AI开发者们送上了一份大礼。

性能对标顶级,强化学习是关键

根据官方披露的信息,DeepSeek-R1的亮点在于其后训练阶段。团队大规模采用了强化学习技术,关键在于,他们做到了在极少依赖人工标注数据的情况下,依然让模型的推理能力获得了极大提升。效果如何呢?结果是令人振奋的——在数学、代码、自然语言推理等一系列核心推理任务上,其性能已经能够比肩OpenAI的o1正式版。

更有意思的是后续动作。深度求索不仅开源了DeepSeek-R1-Zero和DeepSeek-R1两个660B的“大家伙”,还做了一件对社区更友好、更具普惠意义的事:他们利用DeepSeek-R1的输出,蒸馏出了一系列小体量模型并开源。其中,32B和70B的蒸馏模型在多项能力评测中,表现甚至超越了OpenAI的o1-mini。这相当于为资源有限的开发者和研究者,提供了触手可及的高性能推理工具。

对于普通用户而言,想体验这个强大的推理能力其实非常简单。只需登录DeepSeek官网或打开官方App,启用那个叫做“深度思考”的模式,就能直接调用最新的DeepSeek-R1来处理各种需要复杂推理的任务了。

DeepSeek-R1 模型发布,性能对标 OpenAI o1 正式版

极具竞争力的定价与彻底的开源姿态

当然,商业化应用的代价也是大家关心的。DeepSeek-R1的API服务定价策略相当有冲击力:输入tokens每百万仅需1元(缓存命中)或4元(缓存未命中),输出tokens每百万收费16元。这个价格在当前的市场上,竞争力不言而喻。

但比起定价,深度求索此番更显魄力的,是其近乎彻底的开源姿态。他们选择将DeepSeek-R1的训练技术全部公开。与此配套的是,公司在协议授权层面也做出了两项重大调整:

首先,模型开源License统一至MIT。公司坦诚,之前为了适应大模型开源的特点,曾参考行业实践引入了自定义的DeepSeek License。但实践下来发现,非标准协议反而增加了开发者的使用成本和理解门槛。于是,这次他们决定“化繁为简”,将所有开源仓库(包括模型权重)统一采用最标准化、最宽松的MIT License。这意味着完全开源、不限制商用,而且无需任何申请流程。

其次,产品协议明确允许“模型蒸馏”。为了进一步推动技术的扩散与再创新,深度求索决定明确支持用户进行“模型蒸馏”。他们已经更新了线上产品的用户协议,白纸黑字地允许用户利用模型的输出,通过蒸馏等方式来训练自己的新模型。这在很大程度上打消了开发者在合规性上的顾虑,为生态创新铺平了道路。

从高性能模型发布,到亲民的定价,再到毫无保留的技术开源与友好的使用协议,深度求索的这一系列组合拳,不仅仅是发布了一个产品,更像是在为AI推理技术的普及与社区共建,设定一个新的标杆。接下来的市场反响与生态发展,无疑值得持续关注。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策