DeepSeek-R1 模型发布,性能对标 OpenAI o1 正式版
幻方量化旗下AI公司深度求索正式发布DeepSeek-R1模型
1月20日,AI领域迎来一个重磅消息:幻方量化旗下的深度求索公司,正式发布了其DeepSeek-R1模型,并且毫无保留地同步开源了模型权重。这无疑给开源社区和AI开发者们送上了一份大礼。
性能对标顶级,强化学习是关键
根据官方披露的信息,DeepSeek-R1的亮点在于其后训练阶段。团队大规模采用了强化学习技术,关键在于,他们做到了在极少依赖人工标注数据的情况下,依然让模型的推理能力获得了极大提升。效果如何呢?结果是令人振奋的——在数学、代码、自然语言推理等一系列核心推理任务上,其性能已经能够比肩OpenAI的o1正式版。
更有意思的是后续动作。深度求索不仅开源了DeepSeek-R1-Zero和DeepSeek-R1两个660B的“大家伙”,还做了一件对社区更友好、更具普惠意义的事:他们利用DeepSeek-R1的输出,蒸馏出了一系列小体量模型并开源。其中,32B和70B的蒸馏模型在多项能力评测中,表现甚至超越了OpenAI的o1-mini。这相当于为资源有限的开发者和研究者,提供了触手可及的高性能推理工具。
对于普通用户而言,想体验这个强大的推理能力其实非常简单。只需登录DeepSeek官网或打开官方App,启用那个叫做“深度思考”的模式,就能直接调用最新的DeepSeek-R1来处理各种需要复杂推理的任务了。
极具竞争力的定价与彻底的开源姿态
当然,商业化应用的代价也是大家关心的。DeepSeek-R1的API服务定价策略相当有冲击力:输入tokens每百万仅需1元(缓存命中)或4元(缓存未命中),输出tokens每百万收费16元。这个价格在当前的市场上,竞争力不言而喻。
但比起定价,深度求索此番更显魄力的,是其近乎彻底的开源姿态。他们选择将DeepSeek-R1的训练技术全部公开。与此配套的是,公司在协议授权层面也做出了两项重大调整:
首先,模型开源License统一至MIT。公司坦诚,之前为了适应大模型开源的特点,曾参考行业实践引入了自定义的DeepSeek License。但实践下来发现,非标准协议反而增加了开发者的使用成本和理解门槛。于是,这次他们决定“化繁为简”,将所有开源仓库(包括模型权重)统一采用最标准化、最宽松的MIT License。这意味着完全开源、不限制商用,而且无需任何申请流程。
其次,产品协议明确允许“模型蒸馏”。为了进一步推动技术的扩散与再创新,深度求索决定明确支持用户进行“模型蒸馏”。他们已经更新了线上产品的用户协议,白纸黑字地允许用户利用模型的输出,通过蒸馏等方式来训练自己的新模型。这在很大程度上打消了开发者在合规性上的顾虑,为生态创新铺平了道路。
从高性能模型发布,到亲民的定价,再到毫无保留的技术开源与友好的使用协议,深度求索的这一系列组合拳,不仅仅是发布了一个产品,更像是在为AI推理技术的普及与社区共建,设定一个新的标杆。接下来的市场反响与生态发展,无疑值得持续关注。
