年AI深度总结:从DeepSeek R1到Manus出海

2026-06-15阅读 0热度 0
DeepSeek

2025年的AI行业,如果用一句话来概括,那就是:始于一场开源风暴,终于一场商业豪赌。年初,DeepSeek R1的横空出世,像一颗石子投入平静的湖面,激起了整个技术圈的涟漪;年末,Manus被Meta以数十亿美元收购的消息,则为这一年画上了一个巨大的惊叹号。这两件事,一头扎进技术民主化的浪潮,一头撞开商业价值化的大门,恰好构成了理解2025年AI发展的两个锚点。

站在2025年最后一天往回看,吴恩达那句“2025年,是AI工业时代的黎明”尤为贴切。在经历了前两年“大炼模型”的狂热之后,AI终于从单纯的“概率模仿”跃迁到了“逻辑推理”的新阶段,从“对话框”里的问答,转向了“行动流”里的执行。技术突破与产业落地不再是两条平行线,而是紧密交织在一起。AI的角色正在悄然转变——从“辅助工具”走向“自主执行者”,这或许是2025年最深刻的变革。


始与终:定义2025年的两个锚点

1. 始于DeepSeek R1:开源推理的“破壁人”

时间:2025年1月20日(春节前夕)
事件:DeepSeek发布并开源DeepSeek-R1推理模型

意义:

  • 性能突破:DeepSeek R1在AIME竞赛中的表现确实亮眼,以52.5%的pass@1准确率打破了当时闭源模型的统治地位,而它的API价格仅为OpenAI o1的3.7%。这不仅仅是一个技术上的突破,它更意味着AI推理服务的成本结构,进入了一个全新的时代。国内企业第一次在全球AI竞赛中找到了属于自己的节奏,也直接引爆了全球AI推理市场的价格战。
  • 格局重塑:它的出现,让不少人改变了看待推理模型的方式。通过蒸馏与强化学习的结合,小规模的模型也能拥有顶级的推理能力,这彻底打破了“只有大模型才能推理”的固有认知。DeepSeek R1的发布,不仅为2025年定下了技术演进的基调,也大大加速了全球AI技术民主化的进程。

2. 终于Manus:Agent时代的“商业神话”

时间:2025年12月(年末)
事件:通用Agent产品Manus被Meta以数十亿美元收购

意义:

  • 概念落地:Manus的成长速度令人咋舌。从最初的概念模型到10个月内实现商业化,它凭借强大的跨软件执行能力和革命性的工作流重塑,成功打开了Agentic AI(袋里式AI)的新纪元。初期虽有争议,但其功能突破和实际效用,无疑为未来的智能袋里开辟了一片新天地。
  • 价值确认:Meta这次大手笔的收购,其意义远不止于一笔交易。它验证了Manus的技术潜力,更标志着一个核心信号:AI的价值正在从“拥有模型”转向“拥有行动能力”。一个能跨越应用软件壁垒、执行复杂任务并自主规划的智能袋里,才是未来商业化的方向。这起收购不仅是2025年的一个产业标志,更是推动了整个AI智能体市场化的关键一步。

技术范式跃迁:从“预测下一个词”到“System 2 思考”

2025年,AI的底层训练范式发生着根本性的转变。过去那种以“预测下一个词”为核心的模式,正逐渐被更接近人类“慢思考”的“System 2思考”所取代。推理能力的提升,让AI模型具备了深度分析与反思的能力,这为技术带来了新的发展空间。

1. 推理侧Scaling Law的确立

安德烈·卡帕西(Andrej Karpathy)提出的推理能力Scaling Law,在2025年得到了验证。算力的重心开始从训练阶段向推理阶段转移,推理不再仅仅依赖已知知识,而是开始依托更复杂的思维链与自我反思,这成为了提升AI性能的核心。简单来说,AI的性能公式变成了:
[ Performance ∝ TrainingCompute × InferenceThinkingTime ]
这意味着,AI推理性能不再只取决于训练时投入了多少算力,推理过程中的“思维时间”同样至关重要。

2. “氛围编程”(Vibe Coding)成真

推理能力的提升直接带来了编程领域的革命。曾经只是个概念的“氛围编程”,如今正变为现实。在这个模式下,程序员不再需要纠结于复杂晦涩的语法,只需用自然语言描述自己的意图,AI就能自主完成代码的编写。这大大降低了开发门槛,也为更多非专业人士打开了编程的大门。

像Claude Code和Cursor这类AI编程工具,正是这一理念的完美体现。它们让编程变得更简单、更高效,为开发者带来了前所未有的体验。这种变革不仅提升了工作效率,更推动了AI与人类创造力的深度融合。


2025年度“诸神之战”:生态版图盘点

2025年的模型竞争呈现出一种“锯齿状”的智能特征——模型在特定领域表现得像个天才,但在基础常识上偶尔也会犯些低级错误。基于多方评测与观察,年度生态版图如下:

奖项/领域 得奖/代表模型 核心理由
???? 年度大模型 DeepSeek R1 无论性能还是影响力,它都定义了2025年的开源与推理方向,远不止技术产品,更是一个象征。
✍️ 年度写作 GPT-5.2 Thinking 在指令遵循与风格迁移上堪称集大成者,彻底摆脱了以往的“AI味”,文笔自然且逻辑严密。
???? 年度Coding Gemini 3.0 Pro 凭借超强的前端审美与交互能力,让创意能“想到即做到”,是快速验证灵感的绝佳工具。
???? 年度绘图 Nano Banana 原生多模态的代表作,掀起了全民创作热潮,成为AI绘图领域的一个分水岭。
???? 年度音乐 Suno V5 将AI音乐的门槛拉高了好几个Level,直接引发了B站鬼畜区与二创的“文艺复兴”。
???? 年度视频 Sora2 凭借“像真的”和“好玩”这两大特质成功破圈,让普通用户也能体验一把大片制作的快感。
????️ 年度声音 MiniMax Speech 2.0 首次实现了逼近真人的情绪表达,让AI声音有了“悲伤”与“欢愉”的温度,不再是冷冰冰的机器音。

2024&2025年度AI大事件里程碑

回顾过去两年,AI领域完成了一次从“对话助手”到“终端同事”的跨越。以下是几个关键里程碑事件,记录了这一进程。

时间 事件 / 模型 关键意义
2024 年
2 月 Google Gemini 1.5 Pro 长上下文技术突破,100万token窗口彻底改变了AI理解代码库的方式。
3 月 Devin 发布 首个“AI软件工程师”亮相,虽后期声量减弱,但确立了“AI独立完成功能”的愿景。
4 月 GitHub Copilot Workspace 规范驱动开发的雏形出现,AI开始依据需求文档直接生成可运行代码。
5 月 OpenAI GPT-4o 实时多模态交互登场,开发者可以用截图+语音与AI结对编程,交互从“文本”扩展到“任意信号”。
6 月 Claude 3.5 Sonnet & Artifacts 工作流可视化革命:Artifacts将代码/文档生成独立窗口,实现了“所见即所得”的实时预览。
8 月 Cursor Composer IDE里程碑:多文件编辑功能落地,AI从“补全助手”升级为“项目级协作伙伴”。
9 月 OpenAI o1 & Qwen 2.5 o1用强化学习把复杂推理准确率提升4倍;Qwen 2.5让开源代码模型首次逼近闭源第一梯队。
10 月 OpenAI Canvas 画布式编程界面普及,提供独立协作区,支持边写边改、版本对比,进一步降低迭代摩擦。
11 月 Claude MCP & Windsurf IDE MCP协议打通了工具间的上下文壁垒;Windsurf让IDE能实时“读懂”整个项目,为后续Agent互联奠定了基础。
2025 年
1 月 DeepSeek R1 & OpenAI Operator 强推理模型+Web Operator组合,让复杂算法的Debug准确率提升20%,开启了“AI代替人工点网页”的元年。
2 月 Claude 3.7 Sonnet & Claude Code 终端袋里登场:AI直接在命令行装包、跑脚本、调系统,开发者第一次把root权限交给了模型。
3 月 DeepSeek V3 & 字节 Trae IDE 671B-MoE仅激活37B就拿下了24项SOTA;Trae的“Builder Mode”让开发者从“写代码”变成了“审代码”。
3 月 Manus 现象级发布 通用Agent产品海外内测,月活峰值达2000万,确立了“AI承包整件工作”的用户心智。
4 月 Google Antigra vity & A2A 协议 首创Manager View管理多Agent;发布A2A (Agent-to-Agent)协议,打破了智能体间的沟通壁垒,迈向“多智能体协作网络”。
5 月 GitHub Copilot Agent Mode & Google IDX 升级 IDE插件全面Agent化:AI能主动监测、诊断并修复代码;IDX云端全栈开发再强化,实现了“零配置”上线。
6 月 Google Gemini 2.5 Pro 上下文扩展至3M token,视频理解M-VBench首次超过90%,奠定了年底Gemini 3的王者地位。
6 月 豆包大模型 1.6 字节跳动首创“按输入长度区间”计费,价格比DeepSeek-R1再降63%,推动“按字计价”成为行业标配。
6 月 MiniMax M1 开源 国内首个10M上下文开源推理模型,API定价低至0.1元/百万token,打破了长文本与低价不可兼得的魔咒。
7 月 Sora 2 正式开放 API 最长60秒1080P视频,支持镜头脚本分镜,价格比Runway Gen-3低55%,让“短视频工业化”走进了MCN流水线。
7 月 Suno V4 从Prompt到3分钟完整编曲+人声+母带,一键生成可商用版权,Billboard首支AI冠单诞生,音乐圈开始讨论“录音室夕阳产业”。
7 月 Qwen3-Coder 发布 开源代码模型的最强音,32B版本在HumanEval上超越了GPT-4o,企业私有化部署门槛再降50%。
8 月 Vibe Coding 成为主流 Stack Overflow报告显示,62%的开发者用自然语言生成90%的样板代码,“氛围编程”正式写入主流开发流程。
8 月 智谱发布 AutoGLM 2.0 全球首个“PhoneUse”级开源手机Agent,代码+权重+数据全开放,硬件厂可以零门槛植入“AI自动驾驶手机”。
8 月 Nano Banana 正式亮相 谷歌匿名盲测的Gemini 2.5 Flash Image,一致性效果断层领先,被行业称为“Photoshop杀手”。
9 月 Anthropic 对华“断供” Claude 首次以“资本背景”为由封禁API,国内编码产品集体受到影响,智谱、DeepSeek当天上线“一键搬家”服务,国产模型迎来替代窗口期。
9 月 中国开源模型使用量占比破 30% 从2024年底的仅1.2%飙升至30%,DeepSeek、Qwen、MiniMax位列全球调用量前三,标志中国开源生态进入“顺差”时代。
11 月 Gemini 3 正式发布 多模态4K 60fps视频理解、长上下文5M token、MoE仅激活8B,拿下30项SOTA,谷歌时隔三年重夺“最强通用模型”称号。
11 月 GPT-5.1 发布 OpenAI三周年节点推出,多模态智能体能力增强,但一周后即被Gemini 3反超,首次出现“发布即落后”的尴尬局面。
11 月 Nano Banana Pro 升级 基于Gemini 3 Pro图像模型,支持4K输出与多步自检流程,在LMArena图像编辑榜上断层第一,标志谷歌重夺视觉生成霸权。
11 月 Claude Opus 4.5 登场 SWE-bench首次突破80%,被开发者誉为“最强代码模型”,带动Anthropic估值再涨200亿美元。
12 月 豆包 × 中兴“AI 手机”预售 系统级嵌入豆包1.7,配备专属AI侧键、屏幕视觉理解、跨App自动执行,首销3分钟破10万台,硬件厂第一次把“大模型当芯片卖”。
12 月 智谱开源 AutoGLM 全球首个“PhoneUse”级开源手机Agent,代码+权重+数据全开放,硬件厂可零门槛植入“AI自动驾驶手机”。
12 月 GLM-4.7 & o3-Codex & Spec Kit&Claude Skills开源 Spec Kit把Context Engineering从玄学变成工程标准;BMAD引入20+角色Agent,规范驱动编程生态爆发,AI软件工程进入“标准化”元年。
12 月 Meta 完成收购 Manus 仅用十余天闪电谈判,以数十亿美元收购蝴蝶效应,成为Meta史上第三大并购;创始人肖弘出任Meta副总裁,团队整体迁往新加坡继续独立运营。

结语与未来:迈向“中程阶段”

2025年,AI行业告别了早期的狂热与盲从,进入了一个更稳健、更务实的“中程阶段”。

这一年,我们既看到了DeepSeek R1如何凭借开源打破僵局,也目睹了Manus如何通过智能袋里的创新实现巨大的商业成功。AI正在从“辅助工具”转变为“自主执行者”,其应用已深入至企业、工业乃至日常生活的方方面面。从端侧成功跑通100B模型,到人形机器人进驻工厂,“AI不再是空洞的概念,而是像水电煤一样的基础设施”。

展望2026年,AI将进入一个更精细化、应用导向的阶段。技术挑战与商业化进程将并行推进,全球AI生态将迎来更多创新与变革。


前瞻:2026年AI行业的十大战略预测

  1. 多模态Agent将实现更高效的端到端闭环,从“试验性工具”向“实际应用”转变。
  2. AI商业化进入“盈利时代”,企业将更加关注投资回报率。
  3. 行业垂直化加速,AI将深入各行各业,推动生产力提升。
  4. 算力与能效瓶颈将驱动创新,绿色计算与低能耗硬件成为主流。
  5. AI硬件市场将迎来爆发,专用AI加速芯片和推理芯片需求大幅增长。
  6. AI治理机制将逐步标准化,数据隐私与安全将成为监管重点。
  7. 企业内AI数字员工将成为新常态,AI与人类的协作模式成为生产力核心。
  8. 边缘计算与AI协同发展,更多推理任务将转移至边缘设备,提高实时性与隐私性。
  9. 用户体验将成为AI产品竞争的新焦点,个性化与智能助手应用将提升用户体验。
  10. AI安全与伦理评估体系将逐步成熟,技术的透明度与公正性将成为行业要求。
免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策