DeepSeek V4全面评测:OpenClaw默认模型性能对比榜单
全球最火的开源Agent框架,刚刚完成了一次关键“换脑”。
就在两天前,随着DeepSeek V4的正式发布,开源AI的王座迎来了新主。而今天,拥有超过25万星标的OpenClaw火速行动,在其最新版本中,将DeepSeek V4 Flash设为了默认大模型,并将V4 Pro同步接入模型库。这意味着,从此刻起,全球每一位更新OpenClaw的用户,打开应用与之对话的“大脑”,就是这颗来自中国的开源新星。
DeepSeek V4成为OpenClaw默认模型
这次合作,堪称一次双向奔赴。对于OpenClaw而言,接入当前最强的开源模型,无疑是其框架能力的巨大升级。而对于用户来说,最直观的感受就是,启动OpenClaw后,默认进入的路线已经切换到了DeepSeek V4 Flash。
不妨看看V4的硬实力。DeepSeek V4 Pro拥有1.6万亿总参数,采用MoE架构,是全球最大的开源模型。而作为默认选项的V4 Flash,虽然总参数为284B,激活参数为13B,体量更小、速度更快、成本更低,但其推理能力在Max模式下已几乎追平Pro版本。两者均支持100万token的上下文长度,并采用MIT协议完全开源。
值得注意的是,此次更新并非简单的模型替换。工程团队还修复了DeepSeek在多轮工具调用中可能出现的“思考”与“重放”行为异常。此前,Agent在连续调用工具、切换会话时,容易因推理内容缺失而触发错误。新版本通过补齐相关逻辑,确保了V4系列模型在长链路复杂任务中的稳定性。
这类修复看似是技术细节,实则至关重要。因为OpenClaw的核心场景早已超越了简单的聊天对话,更多时候,它需要驱动模型连续调用浏览器、接入会议、处理语音、分析文件、操作插件。模型接入如果只停留在文本生成层面,价值有限。真正决定用户体验的,是它能否稳稳支撑起一整条复杂的任务执行链路。
“龙虾”打电话:Google Meet成内置插件
除了核心模型的升级,本次更新的另一大亮点在于深度整合了实时协作能力。Google Meet被正式加入OpenClaw,成为一个内置的参与者插件。
新版本支持个人谷歌账号授权、通过显式会议链接加入,并整合了Chrome与Twilio的实时传输能力。同时,它也适配了Parallels、BlackHole、SoX等本地音频与浏览器组合的复杂环境。
更关键的变化发生在会议结束之后。OpenClaw现在能够自动处理会议记录、录音转写、生成智能笔记,并将会话内容导出为Markdown或其他格式文件。系统还支持查找最新会议记录,以及扫描历史会议档案。
这意味着,OpenClaw在会议场景中的角色被大大前置了。它不再仅仅是一个事后转写的工具,而是深度参与到会议的进入、实时旁听、内容沉淀与结果回溯的全流程中。过去的AI会议助手大多围绕“记录”展开,而OpenClaw这次尝试将会议本身,变成了一个可被Agent调用和管理的标准化工作节点。
实时语音接入完整Agent
语音交互的边界也被进一步拓宽。目前,Talk、Voice Call和Google Meet插件都可以启用实时语音循环功能。
这次更新的重点在于,实时语音现在能够调用完整的OpenClaw Agent能力。通过特定的咨询接口,电话或会议中提出的问题可以被实时传递给后台的Agent处理。Agent随后可以调用各种工具、查询相关上下文、组织答案,并最终通过语音反馈给用户。
此外,Voice Call插件新增了设置检查和默认的“冒烟测试”命令,用于在真实拨号前确认Twilio等服务商是否就绪。谷歌侧也新增了基于Gemini Live的双向实时语音与函数调用能力。网关服务则加入了基于Gemini Live的实时大脑WebSocket端点,并通过所有者认证进行权限管控。
这一切都指向一个明确的趋势:OpenClaw正在将语音打造为一级交互入口。在传统的文本框之外,电话和会议直播间,正在成为智能体运行的新环境。
浏览器自动化:继续补强工程短板
浏览器自动化能力也得到了针对性增强,这通常是决定Agent能否稳定执行网页任务的关键。
新版本加入了视口坐标点击功能,支持托管自动化与现有会话自动化,命令行侧也新增了相应的坐标点击指令。当网页控件无法被稳定识别时,坐标点击提供了一种可靠的兜底操作方案。
同时,默认的操作预算时间被延长至60秒,减少了因长等待而被误判为失败的情况。浏览器配置文件现在也支持单独设置无头模式,允许其中一个配置文件在后台运行,而不影响其他配置。
针对Google Meet的稳定性修复也集中在浏览器层面:新版本可以复用已打开的Meet标签页,在浏览器超时后尝试恢复会话,并能识别登录、权限请求、麦克风选择等需要人工干预的阻塞点。
这些改动可能不会成为传播的噱头,但它们实实在在地影响着Agent能否7x24小时持续、可靠地工作。浏览器Agent的失败,往往就隐藏在标签页管理、权限弹窗、超时控制和恢复机制这些细微的工程环节里。
插件与模型架构“减负”
在增强功能的同时,OpenClaw也在有意识地降低系统的启动与运行负担。
模型列表改为使用静态目录,减少了默认列举模型时对注册表的枚举开销。模型目录加入了基于清单的模型行,使得提供者索引、缓存、初始化和列表展示等工作,可以在不加载完整的提供者运行时的前提下完成。
插件侧也在进行类似的优化:模型目录、通道配置、设置提供者等信息更多地通过清单文件暴露,仅描述不加载的“契约”也变得更加明确。
随着Google Meet、语音通话、PDF处理、Anthropic Vertex、Bonjour等众多能力被插件化,如果在启动时加载所有运行时代码,必然会拖慢系统。新版本的策略是将描述信息前置,将运行时依赖后置,这是一种典型的工程权衡——牺牲一点早期的兼容便利性,换取更轻快的启动速度和更清晰的插件边界。
SDK的破坏性变更与方向整理
此次更新还包含一项需要开发者注意的破坏性变动:OpenClaw移除了仅适用于Pi的旧版嵌入式扩展工厂API注册方式。
今后,捆绑的工具结果改写需要使用新的Agent工具结果中间件API进行注册,并在相应的合约中声明目标框架。这确保了工具结果转换在Pi和Codex应用服务器动态工具中的行为一致性,受影响的旧接口需要进行迁移。
为此,OpenClaw增加了插件兼容性注册表和迁移记录,用以系统化管理SDK、配置、设置和运行时的弃用路径。这背后,其实是项目在着手清理早期快速扩张阶段所积累的“接口债务”,让整个生态的底层更加规范、清晰。
更清晰的路径:从聊天产品到工作流系统
纵观这次更新,其范围覆盖了模型、会议、语音、浏览器、插件、诊断、TTS乃至Slack、Telegram和MCP等多个模块。
DeepSeek V4的接入,解决了核心的模型能力问题;Google Meet与Voice Call的强化,拓宽了实时协作的入口;而浏览器自动化、插件懒加载与SDK整理,则是在夯实复杂任务运行时所需的工程底座。
一系列动作表明,OpenClaw的演进方向已经愈发清晰:它正从一个智能聊天产品,稳步迈向一个能够调度多种能力、融入真实工作流的智能体操作系统。每一次更新,都是朝着这个目标迈出的坚实一步。








