全球AI模型性价比排行榜:中国模型夺冠深度测评
DeepSeek近期对其API文档进行了一项关键更新,宣布了一项直接影响开发者成本结构的决策:DeepSeek-V4-Pro模型的API定价,在5月31日当前2.5折限时优惠结束后,将不会恢复至原价,而是永久性设定为原定价的四分之一。
这一价格策略精准回应了全球AI产业的核心关切。在算力资源日益成为稀缺资产的背景下,模型的“成本效益比”——即单位投入所能获取的智能产出——已成为技术选型中至关重要的评估指标。香港《南华早报》5月24日援引第三方评估机构Artificial Analysis的分析指出,此次调价将使DeepSeek-V4-Pro直接跃升至全球AI模型性价比排名的首位。
审视近期的价格演进路径,更能理解此次“永久降价”的战略意义。就在4月26日,DeepSeek刚刚宣布了其全系列API输入缓存命中价格的永久性下调。其中,V4-Flash模型从每百万Tokens 0.2元降至0.02元,V4-Pro模型则从每百万Tokens 1元降至0.1元。随后,官方为V4-Pro推出了限时2.5折特惠。多重优惠叠加下,V4-Pro输入缓存命中的实际成本一度低至每百万Tokens 0.025元,未命中缓存价格为3元,输出价格为6元。
如今,原定于5月底结束的折扣被转化为永久性定价。这意味着,优惠期过后,开发者依然能够以极具竞争力的成本调用这款高性能模型。
降价后的性价比优势究竟有多大?Artificial Analysis的评估提供了一个量化对比:使用DeepSeek-V4-Pro完成其AI智能指数基准测试,成本约为268美元。执行相同任务,使用OpenAI的GPT-5.5或Anthropic的Claude Opus 4.7的成本,分别约为DeepSeek-V4-Pro的12倍和19倍。这一成本差距,足以重塑许多项目的技术架构决策与预算分配。
《南华早报》的报道进一步指出一个趋势:在性价比榜单上占据前列的模型,多数源自中国科技公司,例如MiniMax的M2.7模型和小米的MiMo-V2.5-Pro。这显示中国企业在优化AI成本效益方面已形成集群优势,显著降低了行业的技术应用门槛。
市场的另一关键考量在于:价格下调后,性能是否得以维持?从DeepSeek发布的技术报告来看,答案是肯定的。在保持接近全球前沿性能水平的同时,其V4-Pro模型在特定领域的能力获得了显著强化。
根据4月24日的技术报告,DeepSeek-V4-Pro的智能体(Agent)能力,尤其在Agentic Coding评估中,已达到当前开源模型的最佳水准。实际应用反馈甚至优于闭源的Claude Sonnet 4.5,交付质量接近Claude Opus 4.6的非思考模式,尽管与后者的思考模式相比仍存在差距。
在其他核心评估维度上,V4-Pro同样表现突出。在世界知识测评中,它大幅领先于其他开源模型,仅次于谷歌的顶尖闭源模型Gemini-3.1-Pro。在数学、STEM、竞赛级代码等硬核能力评估中,V4-Pro超越了所有已公开评测的开源模型,取得了与全球顶级闭源模型相媲美的成绩。
事实上,DeepSeek在早前的报告中已为此次价格调整做出铺垫。报告曾指出,受限于高端算力资源,当时Pro模型的服务吞吐能力有限。并预计,随着下半年昇腾950超节点的批量交付,Pro模型的价格将迎来“显著下调”。如今,这一承诺已如期落地。
本文系观察者网独家稿件,未经授权,不得转载。
