DeepSeek-V4测评:百万上下文如何重塑AI效率与成本格局
DeepSeek-V4预览版正式发布并同步开源,标志着百万字超长上下文处理能力进入普惠应用阶段。
此次发布的DeepSeek-V4在智能体能力、世界知识储备与复杂推理性能上,实现了国内及开源领域的显著突破。模型提供两个版本,精准适配不同应用场景的需求。
用户现可通过官网或官方App直接体验支持1M上下文的全新模型。开发者可同步调用更新后的API服务,只需将model_name参数调整为deepseek-v4-pro或deepseek-v4-flash即可完成接入。
DeepSeek-V4-Pro:性能比肩顶级闭源模型
作为旗舰版本,V4-Pro展现出卓越的综合性能:
Agent能力大幅跃升:V4-Pro的智能体能力实现质的飞跃。在Agentic Coding专项评测中,其表现达到当前开源模型最优水平,其他智能体任务测试同样出色。该模型已是深度求索内部员工使用的编码智能体,内部反馈显示其使用体验优于Claude 3.5 Sonnet,交付质量接近GPT-4o非思考模式,与GPT-4o思考模式的差距正在快速缩小。
知识储备接近顶尖:在世界知识测评中,V4-Pro大幅领先其他开源模型,表现仅稍逊于谷歌Gemini Pro 3.1,展现出广泛而深入的知识覆盖能力。
推理性能跻身顶级梯队:在数学、STEM及竞赛级代码等硬核推理测评中,V4-Pro超越所有已公开评测的开源模型,成绩足以比肩世界顶级闭源模型。
DeepSeek-V4-Flash:更快捷高效的经济之选
V4-Pro定位为追求极致性能的全能选手,V4-Flash则是兼顾效率与成本的实用方案。
该版本在世界知识储备上略低于Pro版,但推理能力相当接近。凭借更小的模型参数和激活量,V4-Flash能提供更快速、更经济的API服务,是高并发处理或成本敏感场景的理想选择。
在Agent任务测试中,V4-Flash处理简单任务时与Pro版本表现相当,但在高难度、多步骤的复杂任务处理上,两者仍存在性能差距。
结构创新与超高上下文效率
V4系列的核心突破在于底层架构创新。模型采用全新的注意力机制,通过在token维度进行智能压缩,结合自研的DSA稀疏注意力技术,实现了全球领先的长上下文处理能力。
关键在于,这种创新并未牺牲效率。相比传统长上下文处理方法,新技术显著降低了对计算资源和显存的需求,使百万字上下文处理真正可行。官方信息显示,1M上下文将成为DeepSeek所有官方服务的标准配置,这大幅降低了长文本分析的技术门槛。
DeepSeek-V4 和 DeepSeek-V3.2 的计算量和显存容量随上下文长度的变化
Agent能力专项优化
为提升实际应用效果,DeepSeek-V4针对Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent产品框架进行了专门适配和优化。这意味着在代码生成、文档撰写等具体任务中,模型的输出质量和实用性得到进一步提升。下图展示了V4-Pro在某Agent框架下生成的PPT内页示例,其结构化和内容组织能力可见一斑。
上下滑动或点击放大查看
API访问指南
DeepSeek API平台已同步上线V4-Pro与V4-Flash两个新模型,同时支持OpenAI ChatCompletions接口与Anthropic接口格式,方便开发者无缝迁移。
调用时,base_url保持不变,只需将model参数改为deepseek-v4-pro或deepseek-v4-flash即可。
V4-Pro 与 V4-Flash 最大上下文长度为 1M
两个版本均同时支持非思考模式与思考模式。在思考模式下,用户可通过reasoning_effort参数(可选high/max)调整模型的思考强度。对于复杂的Agent场景,官方建议使用思考模式并将强度设置为max,以获得更优结果。具体模型调用与参数调整方法,请参考API文档。
开发者需注意,旧版API接口中的deepseek-chat与deepseek-reasoner模型名称将于三个月后(2026年7月24日)停止服务。过渡期内,这两个旧名称将分别指向deepseek-v4-flash的非思考模式与思考模式,为开发者留出充足迁移时间。
开源权重和本地部署
秉承开源精神,DeepSeek-V4的模型权重已同步公开:
- 模型开源链接:
Hugging Face: https://huggingface.co/collections/deepseek-ai/deepseek-v4
ModelScope: https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4 - 技术报告:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
写在后面的话
「不诱于誉,不恐于诽,率道而行,端然正己。」
每次技术迭代都离不开社区用户的信任、反馈与期待。这些声音是团队持续探索、专注创新的核心动力。在通往AGI的道路上,秉持长期主义理念,在持续尝试与深度思考中稳步前行,依然是深度求索坚持的方向。