最新风口Harness,李开复、陆奇已重金入场
一个正在浮现的新共识
让一个AI智能体独立扛起超过24小时的长程任务,十有八九会出岔子。这几乎是所有从业者都头疼的难题。如今,行业里正浮现出一个新的解题思路:Harness,或者说,群体多智能体。有意思的是,曾被称为“小冰之父”的李笛,带着原班人马创立的公司,在连续完成两轮融资后,即将在月底推出一款被视为“小冰岛”精神续作的产品,目标直指让每个人都能拥有一支专属的AI小分队。
问题究竟出在哪里?归根结底是两座大山:高昂的Token成本,以及长程任务中那令人揪心的不稳定性。
想象一下,你把一个能力强大的智能体丢进一个需要跨越数天的复杂任务里,然后放手不管。结果往往不尽如人意:要么是预算烧光了,任务才完成一半;要么是它在某个环节稍稍跑偏,便一路错到底,最终交回一个完全无法使用的成果。
Meta安全对齐总监Summer Yue的邮箱被AI一夜清空的故事,早已在圈内成为“经典案例”。
https://x.com/summeryue0/status/2025774069124399363
更早之前,也不乏智能体将敏感公司数据泄露给无权限员工的尴尬事件。
这些案例共同指向一个核心矛盾:越聪明的单体智能,一旦被置于更长的时间维度和更复杂的协作链条中,就越容易在关键节点上掉链子。这就像一个智商超群却无人督导的实习生,前半程表现惊艳,后半程就开始自己给自己制造难题。
于是,行业里逐渐形成一个新认知:光让模型变得更聪明远远不够,还必须有一套机制来管理它如何运用自己的“聪明”。这套机制,最近有了一个越来越高频出现的名字——Harness。
Harness:从“马具”到智能缰绳
Harness这个词,本意是马具。放在AI的语境下,它特指连接“模型(马匹)”与“人类需求(骑手)”的那套控制与调度框架。
说得更直白些,在一个智能体系统中,除了作为“大脑”的基础模型(例如Claude Opus 4.6),其余确保其正确、高效、可控运行的部分,都可以归入Harness的范畴。它不直接参与任务执行,也不追求自身变得更“聪明”,但它决定了这匹马往哪个方向跑、跑多快、以及何时应该停下。
这一判断并非孤例,而是正在成为顶尖玩家的共识。
今年2月,OpenAI发布了一篇题为《Harness Engineering: Leveraging Codex in an Agent-First World》的博客,通过一组实验证明,一个三人工程师小组借助Harness Engineering方法,能在五个月内驱动智能体写出百万行代码级别的产品。
https://openai.com/zh-Hans-CN/index/harness-engineering/
无独有偶,Anthropic近期推出的新智能体架构“Managed Agents”,其技术文档中也反复强调了“Agent Harness”这一概念。
这意味着,在OpenClaw等现象级产品之后,行业领导者们几乎同步意识到,传统的提示工程(Prompt Engineering)和上下文工程(Context Engineering)已显不足,需要更高层级的约束与调度系统。
Harness的逻辑初看有些反直觉:用约束换取更大的自主空间。但背后的道理其实很朴素:自主权越大的系统,越容易偏离轨道。为它套上一套精良的“马具”,反而能让它跑得更稳、更远。这一共识正在快速凝聚。对于普通用户而言,未来半年到一年,很可能会涌现一批新的AI产品,它们的宣传重点将不再是“我的模型有多大”,而是“我多么擅长驯服和调度模型”。
就在这个转折点上,一家成立仅四个多月的公司,已经悄然将两轮重量级融资收入囊中。
陆奇和李开复罕见同框的一家公司
这家公司名叫明日新程(Nextie)。4月13日,它宣布连续完成天使轮及后续一轮融资。天使轮由创新工场和Atypical Ventures联合领投,奇绩创坛继续跟投,参投方还包括原微软全球副总裁Da vid Ku等个人投资者。
Da vid Ku
充足的资金储备足以支撑其未来三到五年的持续创新。在当前一级市场整体趋冷的背景下,融资额本身或许不算最引人注目,真正让业内侧目的是其投资人名单——陆奇与李开复罕见地同时出现,共同押注同一家智能体初创公司。
陆奇
李开复
两位被视为AI产业风向标的人物,同时出现在一家仅成立一个季度的公司股东名单上,这本身就是一个强烈的信号。然而,让这个故事更具分量的,除了投资人,还有公司的掌舵者——李笛,前微软亚洲互联网工程院副院长。
李笛
在AI圈,他更为人熟知的身份是“小冰之父”。
2018 年,第 6 代小冰
要理解李笛此次创业的目标,或许需要先回顾他过去几年未竟的探索。2024年底,当Transformer架构的潜力初现峥嵘时,李笛曾在小冰内部提议尽快采购GPU,加速训练更大规模的模型,但这个提议在当时被搁置了,错过了基础模型能力跃升的关键窗口期。2024年2月,他的团队推出了“小冰链(X-CoTA)”项目。如今回看,小冰链所做的事,几乎就是后来震动行业的“思维链(CoT)”技术,让模型在输出答案前先将推理过程显性化。该项目仅用GPT-3约2%的参数量,便实现了可观测、可追溯的思维链构建,但仅存活一个月后便在当年3月被叫停,理由据称是“看不懂,不让做”。到了2024年底,小冰日本业务发展良好,资金充裕,团队再次提议研发推理模型,这一方向又一次在当时的决策框架下被否决。
李笛后来在访谈中将这段经历称为“至今唯一一次深深的遗憾”,其大意是,失去的不仅是一个项目,更是一年半到两年的宝贵时间。将这些节点串联起来,会发现小冰内部其实早已埋下多颗可能引领潮流的种子——基础模型、思维链、推理能力,每一个都精准命中了后续行业爆发的方向,可惜都未能在关键时刻破土而出。
2025年12月9日,李笛带领微软小冰的创始核心团队成立了明日新程。四个月后,他的竞业限制期正式结束。这意味着,那些在他脑海中反复推演多年的构想,终于可以从头开始,亲手实现。
220 年的学术文献造就高级智能
这次他要从头构建的东西,名为“群体智能”。这个想法并非凭空产生。李笛的团队曾系统梳理了从1800年至2020年长达220年的人类学术文献,核心目的只有一个:搞清楚人类社会作为一个成功的群体智能系统,究竟是如何一步步形成大规模、高效的高级认知协同的。这几乎是目前唯一被历史验证过的、能持续创造巨大价值的群体智能样本。
这一宏大研究的落脚点却非常具体。明日新程于今年2月发布的首款产品“团子(tuanzi.ai)”,便体现了这种思路。当用户提出一个问题,数十个智能体会像专家小组一样“围坐一桌”,各自从不同视角切入,进行补充、辩论甚至交锋,过程中还引入了投票表决、同行评审等专业环节。李笛在内部将这套机制称为“认知碰撞”。
这里存在一个反常识的现象。按常理,多个智能体协作理应比单体消耗更多Token,毕竟“人多嘴杂”。但“团子”跑出的实际数据显示,在达到同等思考深度的情况下,整体Token消耗反而降低了50%以上。奥秘在于“协调税”这个概念。传统的多智能体架构中,随着环节和分支增多,上下文信息会被层层复制传递,导致Token消耗呈指数级增长。明日新程的解法是,让每一个协作环节都实现“收敛”。辩论、质疑、反思、投票等动作的目的,不是让信息无限发散,而是让它在每一层都经过提炼、达成阶段性共识后,再传递至下一环节。
这本质上是从人类社会协作中汲取的智慧。一场高效的会议,并非让每个人畅所欲言即可,更重要的是在争论后能收敛出共识,并带着这个共识进入下一议题。“团子”在智能深度评测(IDI)指标上,于长程多智能体协同、高难度研究任务和大规模群体仿真等场景中,均显著超越了包括GPT-5.2 Thinking在内的单一大模型。不过,以上更多是从B端视角看到的价值。真正更具普适性的变化,藏在明日新程即将于4月底推出的新产品中。
「小冰岛」要回来了?能做更多
李笛在近期访谈中透露,团队正在全力打造一款形态上接近“小冰岛”的新产品。由于知识产权限制,它不会再使用这个名字,但核心理念一脉相承,并采用了全新的技术架构。
“小冰岛”对于老用户而言,承载着特殊的情感。其最初的设计理念,是围绕每一个具体的用户,探究究竟配置一群怎样的AI最为合适。有人需要工作支持加情感陪伴,有人则更看重理性决策辅助,每个人的“最优AI阵容”本就该是千人千面的。
当年开发小冰岛时,技术上存在诸多难以逾越的障碍。例如一个具体场景:用户在岛上对某个AI说“我失恋了”。以当时的技术,这条信息要么被粗暴地广播给所有AI,导致全员一拥而上进行安慰,反而让用户陷入尴尬;要么仅被该AI知晓,其他AI因缺乏上下文而无法形成真正的情感支持网络。两种处理方式都不理想。问题的症结不在于单个AI是否足够聪明,而在于这群AI之间是否具备一套合理的协同机制,懂得什么信息该传递、传递给谁、何时传递。
这正是群体智能旨在解决的核心问题。据李笛描述,新产品中的智能体将具备这种“智能判断力”,用户的每一次交互,都将在智能体群体中激起合理、有分寸的涟漪,而非要么“全员轰炸”,要么“全员静默”。
对于普通用户,这件事的吸引力可以翻译成一句大白话:每个人都能拥有一支高度个性化、懂得协同作战的AI小分队。队内成员各司其职,彼此知晓如何配合,能够共同完成时间跨度长、流程复杂的任务。最近流行的“OPC(一人公司)”概念,听上去或许像空中楼阁。但要让一个人真正具备一家公司的执行力,仅靠一个聊天机器人是远远不够的,需要的是一整个能够自主协作的团队。群体智能结合Harness架构,首次为这件事提供了可实际操作的底层基础。
据最新透露,如果用户已经拥有一个高度定制化的智能体(比如一只“龙虾”),只需一句指令就能让它加入这个Agent群体,成为专属小分队里的“特种兵”。这种开放性至关重要,它意味着产品并非要求用户从头学习一套全新生态,而是允许他们将手中已有的得力工具无缝整合进来。产品尚未正式发布,具体体验暂无法评价。但从理念层面可以看出,明日新程的思路是优先将底层的协同机制做扎实,然后让用户在此稳固的底座上,搭建属于自己的个性化智能体群体,而非一开始就塞给用户一个看似全能、实则笨重的“超级助理”。按计划,这款产品将于4月底正式亮相,那才是检验群体智能能否成功走向普通消费者的关键时刻。
单体的尽头是群体
将时间轴拉长来看,这一轮围绕Harness和群体智能的集体转向,实际上是在回应一个更根本的问题。过去三年,AI行业的叙事主线一直是“让单体变得更强大”——参数更多,上下文更长,推理更深。这条路径仍在继续,但越来越多的人开始意识到,真正的瓶颈或许不在于单体能力的天花板,而在于协同结构的缺失。
人类社会能够数千年持续创造价值,依靠的也并非某个“超级大脑”,而是无数普通大脑之间,摸索出了一套“即使争吵也能最终形成共识”的协同机制。AI若想接手更长、更复杂、更贴近真实世界的任务,很可能绕不开同一条进化路径。
这一转向对普通用户的意义,或许尚未达到立竿可影的程度,但它正在悄然重塑未来一两年所有AI产品的底层逻辑。回到文章开头那个问题:为何聪明绝顶的单体智能体,一遇到长程任务就容易“翻车”?答案如今似乎清晰了一些:单体智能本就不是为长程复杂任务而设计的。这类任务天然需要一个群体,以及一套能确保该群体避免陷入“群体迷思”或“群体愚蠢”的协同框架。明日新程所押注的,正是这个未来。小冰的故事远未结束,它只是换了一个名字,在新的舞台上继续讲述。
2024 年,第 9 代小冰








