最新风口Harness，李开复、陆奇已重金入场

2026-04-27阅读 494热度 494

Token

一个正在浮现的新共识

让一个AI智能体独立扛起超过24小时的长程任务，十有八九会出岔子。这几乎是所有从业者都头疼的难题。如今，行业里正浮现出一个新的解题思路：Harness，或者说，群体多智能体。有意思的是，曾被称为“小冰之父”的李笛，带着原班人马创立的公司，在连续完成两轮融资后，即将在月底推出一款被视为“小冰岛”精神续作的产品，目标直指让每个人都能拥有一支专属的AI小分队。

问题究竟出在哪里？归根结底是两座大山：高昂的Token成本，以及长程任务中那令人揪心的不稳定性。

想象一下，你把一个能力强大的智能体丢进一个需要跨越数天的复杂任务里，然后放手不管。结果往往不尽如人意：要么是预算烧光了，任务才完成一半；要么是它在某个环节稍稍跑偏，便一路错到底，最终交回一个完全无法使用的成果。

Meta安全对齐总监Summer Yue的邮箱被AI一夜清空的故事，早已在圈内成为“经典案例”。

https://x.com/summeryue0/status/2025774069124399363

更早之前，也不乏智能体将敏感公司数据泄露给无权限员工的尴尬事件。

这些案例共同指向一个核心矛盾：越聪明的单体智能，一旦被置于更长的时间维度和更复杂的协作链条中，就越容易在关键节点上掉链子。这就像一个智商超群却无人督导的实习生，前半程表现惊艳，后半程就开始自己给自己制造难题。

于是，行业里逐渐形成一个新认知：光让模型变得更聪明远远不够，还必须有一套机制来管理它如何运用自己的“聪明”。这套机制，最近有了一个越来越高频出现的名字——Harness。

Harness：从“马具”到智能缰绳

Harness这个词，本意是马具。放在AI的语境下，它特指连接“模型（马匹）”与“人类需求（骑手）”的那套控制与调度框架。

说得更直白些，在一个智能体系统中，除了作为“大脑”的基础模型（例如Claude Opus 4.6），其余确保其正确、高效、可控运行的部分，都可以归入Harness的范畴。它不直接参与任务执行，也不追求自身变得更“聪明”，但它决定了这匹马往哪个方向跑、跑多快、以及何时应该停下。

这一判断并非孤例，而是正在成为顶尖玩家的共识。

今年2月，OpenAI发布了一篇题为《Harness Engineering: Leveraging Codex in an Agent-First World》的博客，通过一组实验证明，一个三人工程师小组借助Harness Engineering方法，能在五个月内驱动智能体写出百万行代码级别的产品。

https://openai.com/zh-Hans-CN/index/harness-engineering/

无独有偶，Anthropic近期推出的新智能体架构“Managed Agents”，其技术文档中也反复强调了“Agent Harness”这一概念。

这意味着，在OpenClaw等现象级产品之后，行业领导者们几乎同步意识到，传统的提示工程（Prompt Engineering）和上下文工程（Context Engineering）已显不足，需要更高层级的约束与调度系统。

Harness的逻辑初看有些反直觉：用约束换取更大的自主空间。但背后的道理其实很朴素：自主权越大的系统，越容易偏离轨道。为它套上一套精良的“马具”，反而能让它跑得更稳、更远。这一共识正在快速凝聚。对于普通用户而言，未来半年到一年，很可能会涌现一批新的AI产品，它们的宣传重点将不再是“我的模型有多大”，而是“我多么擅长驯服和调度模型”。

就在这个转折点上，一家成立仅四个多月的公司，已经悄然将两轮重量级融资收入囊中。

陆奇和李开复罕见同框的一家公司

这家公司名叫明日新程（Nextie）。4月13日，它宣布连续完成天使轮及后续一轮融资。天使轮由创新工场和Atypical Ventures联合领投，奇绩创坛继续跟投，参投方还包括原微软全球副总裁Da vid Ku等个人投资者。

Da vid Ku

充足的资金储备足以支撑其未来三到五年的持续创新。在当前一级市场整体趋冷的背景下，融资额本身或许不算最引人注目，真正让业内侧目的是其投资人名单——陆奇与李开复罕见地同时出现，共同押注同一家智能体初创公司。

陆奇

李开复

两位被视为AI产业风向标的人物，同时出现在一家仅成立一个季度的公司股东名单上，这本身就是一个强烈的信号。然而，让这个故事更具分量的，除了投资人，还有公司的掌舵者——李笛，前微软亚洲互联网工程院副院长。

李笛

在AI圈，他更为人熟知的身份是“小冰之父”。

2018 年，第 6 代小冰

要理解李笛此次创业的目标，或许需要先回顾他过去几年未竟的探索。2024年底，当Transformer架构的潜力初现峥嵘时，李笛曾在小冰内部提议尽快采购GPU，加速训练更大规模的模型，但这个提议在当时被搁置了，错过了基础模型能力跃升的关键窗口期。2024年2月，他的团队推出了“小冰链（X-CoTA）”项目。如今回看，小冰链所做的事，几乎就是后来震动行业的“思维链（CoT）”技术，让模型在输出答案前先将推理过程显性化。该项目仅用GPT-3约2%的参数量，便实现了可观测、可追溯的思维链构建，但仅存活一个月后便在当年3月被叫停，理由据称是“看不懂，不让做”。到了2024年底，小冰日本业务发展良好，资金充裕，团队再次提议研发推理模型，这一方向又一次在当时的决策框架下被否决。

李笛后来在访谈中将这段经历称为“至今唯一一次深深的遗憾”，其大意是，失去的不仅是一个项目，更是一年半到两年的宝贵时间。将这些节点串联起来，会发现小冰内部其实早已埋下多颗可能引领潮流的种子——基础模型、思维链、推理能力，每一个都精准命中了后续行业爆发的方向，可惜都未能在关键时刻破土而出。

2025年12月9日，李笛带领微软小冰的创始核心团队成立了明日新程。四个月后，他的竞业限制期正式结束。这意味着，那些在他脑海中反复推演多年的构想，终于可以从头开始，亲手实现。

220 年的学术文献造就高级智能

这次他要从头构建的东西，名为“群体智能”。这个想法并非凭空产生。李笛的团队曾系统梳理了从1800年至2020年长达220年的人类学术文献，核心目的只有一个：搞清楚人类社会作为一个成功的群体智能系统，究竟是如何一步步形成大规模、高效的高级认知协同的。这几乎是目前唯一被历史验证过的、能持续创造巨大价值的群体智能样本。

这一宏大研究的落脚点却非常具体。明日新程于今年2月发布的首款产品“团子（tuanzi.ai）”，便体现了这种思路。当用户提出一个问题，数十个智能体会像专家小组一样“围坐一桌”，各自从不同视角切入，进行补充、辩论甚至交锋，过程中还引入了投票表决、同行评审等专业环节。李笛在内部将这套机制称为“认知碰撞”。

这里存在一个反常识的现象。按常理，多个智能体协作理应比单体消耗更多Token，毕竟“人多嘴杂”。但“团子”跑出的实际数据显示，在达到同等思考深度的情况下，整体Token消耗反而降低了50%以上。奥秘在于“协调税”这个概念。传统的多智能体架构中，随着环节和分支增多，上下文信息会被层层复制传递，导致Token消耗呈指数级增长。明日新程的解法是，让每一个协作环节都实现“收敛”。辩论、质疑、反思、投票等动作的目的，不是让信息无限发散，而是让它在每一层都经过提炼、达成阶段性共识后，再传递至下一环节。

这本质上是从人类社会协作中汲取的智慧。一场高效的会议，并非让每个人畅所欲言即可，更重要的是在争论后能收敛出共识，并带着这个共识进入下一议题。“团子”在智能深度评测（IDI）指标上，于长程多智能体协同、高难度研究任务和大规模群体仿真等场景中，均显著超越了包括GPT-5.2 Thinking在内的单一大模型。不过，以上更多是从B端视角看到的价值。真正更具普适性的变化，藏在明日新程即将于4月底推出的新产品中。

「小冰岛」要回来了？能做更多

李笛在近期访谈中透露，团队正在全力打造一款形态上接近“小冰岛”的新产品。由于知识产权限制，它不会再使用这个名字，但核心理念一脉相承，并采用了全新的技术架构。

“小冰岛”对于老用户而言，承载着特殊的情感。其最初的设计理念，是围绕每一个具体的用户，探究究竟配置一群怎样的AI最为合适。有人需要工作支持加情感陪伴，有人则更看重理性决策辅助，每个人的“最优AI阵容”本就该是千人千面的。

当年开发小冰岛时，技术上存在诸多难以逾越的障碍。例如一个具体场景：用户在岛上对某个AI说“我失恋了”。以当时的技术，这条信息要么被粗暴地广播给所有AI，导致全员一拥而上进行安慰，反而让用户陷入尴尬；要么仅被该AI知晓，其他AI因缺乏上下文而无法形成真正的情感支持网络。两种处理方式都不理想。问题的症结不在于单个AI是否足够聪明，而在于这群AI之间是否具备一套合理的协同机制，懂得什么信息该传递、传递给谁、何时传递。

这正是群体智能旨在解决的核心问题。据李笛描述，新产品中的智能体将具备这种“智能判断力”，用户的每一次交互，都将在智能体群体中激起合理、有分寸的涟漪，而非要么“全员轰炸”，要么“全员静默”。

对于普通用户，这件事的吸引力可以翻译成一句大白话：每个人都能拥有一支高度个性化、懂得协同作战的AI小分队。队内成员各司其职，彼此知晓如何配合，能够共同完成时间跨度长、流程复杂的任务。最近流行的“OPC（一人公司）”概念，听上去或许像空中楼阁。但要让一个人真正具备一家公司的执行力，仅靠一个聊天机器人是远远不够的，需要的是一整个能够自主协作的团队。群体智能结合Harness架构，首次为这件事提供了可实际操作的底层基础。

据最新透露，如果用户已经拥有一个高度定制化的智能体（比如一只“龙虾”），只需一句指令就能让它加入这个Agent群体，成为专属小分队里的“特种兵”。这种开放性至关重要，它意味着产品并非要求用户从头学习一套全新生态，而是允许他们将手中已有的得力工具无缝整合进来。产品尚未正式发布，具体体验暂无法评价。但从理念层面可以看出，明日新程的思路是优先将底层的协同机制做扎实，然后让用户在此稳固的底座上，搭建属于自己的个性化智能体群体，而非一开始就塞给用户一个看似全能、实则笨重的“超级助理”。按计划，这款产品将于4月底正式亮相，那才是检验群体智能能否成功走向普通消费者的关键时刻。

单体的尽头是群体

将时间轴拉长来看，这一轮围绕Harness和群体智能的集体转向，实际上是在回应一个更根本的问题。过去三年，AI行业的叙事主线一直是“让单体变得更强大”——参数更多，上下文更长，推理更深。这条路径仍在继续，但越来越多的人开始意识到，真正的瓶颈或许不在于单体能力的天花板，而在于协同结构的缺失。

人类社会能够数千年持续创造价值，依靠的也并非某个“超级大脑”，而是无数普通大脑之间，摸索出了一套“即使争吵也能最终形成共识”的协同机制。AI若想接手更长、更复杂、更贴近真实世界的任务，很可能绕不开同一条进化路径。

这一转向对普通用户的意义，或许尚未达到立竿可影的程度，但它正在悄然重塑未来一两年所有AI产品的底层逻辑。回到文章开头那个问题：为何聪明绝顶的单体智能体，一遇到长程任务就容易“翻车”？答案如今似乎清晰了一些：单体智能本就不是为长程复杂任务而设计的。这类任务天然需要一个群体，以及一套能确保该群体避免陷入“群体迷思”或“群体愚蠢”的协同框架。明日新程所押注的，正是这个未来。小冰的故事远未结束，它只是换了一个名字，在新的舞台上继续讲述。

2024 年，第 9 代小冰