对话王小川:通用AI之外,顶尖创业者的赛道选择与深度评测

2026-05-23阅读 0热度 0
人工智能

“如果没有转型,继续走主流道路,你也会有同等程度的焦虑。”王小川说。这次转型,让他真正回归到从创业第一天就最想做的事情:造AI医生。

一年前,百川智能进行了一次激烈的“大刹车”:大幅缩减通用模型团队,关闭金融等多条行业线,全面投入医疗大模型。与此同时,整个大模型行业却热闹非凡,大厂和创业公司轮番进行“轰炸式更新”——过去半年里,平均3天就有一个新版本的通用大模型面世。

看起来沉寂的百川在做什么?5月22日,王小川安静地交出了答卷:新一代医疗大模型M4,以及Agent产品“百小医”。

过去三年,百川的路径几经调整,从“要做中国最好的基础大模型”转向“同时押注多个落地场景”,再到“只做医疗”。团队规模不断缩小,部分合伙人离开,原定的上市节奏也因此延迟。

这看似颠簸的路走对了吗?在新产品发布前夕,王小川的状态反而更坦然了。“继续卷通用模型,走主流道路,那是一种选择。即使上市了很风光,但焦虑也不会减少半分。”比起当时公司内外巨大的不理解,以及选择非共识道路的孤独感,他更难以接受的是:“公司快成立两周年了,却不知道自己到底在干什么,创造什么价值。”

在互联网的上一个十年,医疗并不是一门“好生意”——商业化路径漫长,反馈周期动辄以年计。从大厂到初创公司,即使投入高达数十亿元,真正跑通产品市场匹配(PMF)的案例也寥寥无几,更别提获得商业上的巨大成功。

当时,很多公司的选择是给医生提效,或是打通挂号、买药、保险的链路,以此跑通商业闭环。但王小川认为,这些都不是当下最重要的事。他想明白了一点:百川的C端产品必须以患者为中心,目标是增加医生的有效供给,“我们要造更多的医生”。

在这个思路下,百川在医疗的B端场景中有了更多落地进展:在北京儿童医院,百川的两款AI儿科医生已在院内多学科会诊中正式“上岗”。在很多诊疗方案中,AI儿科医生与专家会诊结果的吻合率达95%,并开始向河北省150余家县级医院下沉。

在C端,新上线的Agent产品“百小医”则在App和微信生态中共同提供服务。“百小医”就像一个“AI家庭医生”,不只是提供问答,还会在患者就医前帮助梳理病情、分析处方、管理病例,甚至定时提醒用药和检查。

△图源:百川智能

王小川并不认同“医疗是更长、更慢的一条路”这个观点。“这个想法本身就是一种时代惯性。”他的逻辑是:如果Coding Agent能在几个月内成为史上增长最快的应用场景,就意味着很多旧的边界已经被打破。

从通用大模型的白热化竞争中抽身,All in医疗——对这个选择,王小川坦承,“我的选择不一定对,也不一定错。但可以确定的是,AI时代只要交付给用户足够重要的价值,商业化会是水到渠成的事。”

对于那些依然身处在同质化竞争中的AI公司来说,王小川的选择,至少是一条值得认真审视的路径:去找一个真正相信的问题,然后用足够长的时间回答它。

以下是经过整理的对话内容:

All in医疗有它的代价

问:今年年初发布了医疗大模型M3,今天又发布M4和新产品“百小医”,核心提升在哪里?

王小川:M4是我们的闭源医疗大模型,通过API提供服务。一个核心亮点是采用了Agent架构,从简单的对话走向临床,具备了基于患者全生命周期的记忆能力。

其他突破点有几个:幻觉减少、循证能力增强——我们把指南做了原子化拆解,甚至把专家共识也纳入进来;提问能力也有了很大提升——这对医疗场景很关键,每提升两个点的提问能力,就能增加一个点的诊断准确率。

现在,在肿瘤这类复杂场景里,M4能自己跑完整个Agent工作流——收集数据、校对冲突、调用基因变异数据库、出具诊断建议。它能够自主决策,针对不同的子项肿瘤情况,甚至可以主动查询基因库,做到像经验丰富的医生一样主动提问和管理。

“百小医”是新的To C产品,形态是App和微信上的一个智能体。它可以主动提供处方和病例分析,并做全周期的健康数据管理。

问:如何定义M4模型“做得好”?

王小川:在OpenAI发布的HealthBench测评集上,我们在Hard和Professional两个子集里都是表现最好的模型。我们没有对这个基准做特殊训练,所以模型表现好就是真的好。这个评测集有5000个医患多轮对话场景,262个人类医生编写了近5万条评价规则,不是靠刷榜能刷出来的。

问:当前行业最大的共识是押注Coding,百川却在一年前就选择不走通用模型路线,All in医疗。当时是怎么考虑的?

王小川:AGI的大叙事没问题,但这里面肯定有泡沫,泡沫褪去之后珍珠会留下来。怎么去找这个珍珠?大家会各自押注自己的生态位。做百川到现在,我想做的东西其实没什么变化——当初的初心就是做生命模型,造医生。ChatGPT的出现,反而是这个目标的助力。

我之前可能想得太早,又想得太远了。在2024年的时候你跟别人讲造医生、做生命模型,会发现理解的人不多。

问:但在那个时间点,不卷通用模型,是一种脱离主流赛道的选择。有过担忧吗?

王小川:如果选择主流,你也会有其他的恐惧。不是说我现在做得特别好,只是主流也有主流的问题,不同选择有各自的代价。

我们在2025年4月大调整后开始专注做医疗,也是因为当时临近百川成立两周年,我有巨大的紧迫感。当时公司摊子铺得特别大,从模型、医生到生命模型,再到商业化都在做。那种状态就是不知道自己在干嘛,在创造什么价值。

问:这个决定的代价是什么?

王小川:很多人在那个时候离开了。有同事觉得做通用模型才是对的道路,投资人也有不同意见。当时有各种曲解,比如有人传,小川可能对上市没想法,无所谓,反正自己财务自由了。

问:有些创业公司会选择先不考虑那么远,先赚到钱养活梦想,上市也是一种路径。

王小川:我们那个时候也不缺钱。问题是,上市了,然后呢?

问:百川的一些前高管,以及部分投资人,当时都很难理解这种突然的刹车。

王小川:当然可以想办法把年度经常性收入(ARR)、收入数据做起来,但在当时那也不是我最想要的。

第一,那样你就没精力深耕业务了,拿到收入和真正交付一个好的产品或服务,不是一个维度的事。第二,业务单点还没突破的时候,搞矩阵化管理是特别危险的事。当时销售、产品、技术,每个人身兼数职,为多个产品服务。

这种状态,和公司想实现的价值的判断是没法匹配的。如果从内心就不相信这个事情,也很难做好。

问:那怎么跟投资人解释?

王小川:很难解释。投资人肯定想上市,我只能继续把现在的事做好。

问:4月调整完之后,团队规模、架构,包括整体的工作方法有什么改变?

王小川:我们人数压缩到不超过300人,层级变得扁平,现在大概10多个人直接给我汇报。

现在主要分几大块:一是做医疗模型本身;二是以Agent的形态做AI医生产品;三是做医院体系的合作,通过AI医生,把医院、卫健委等体系联系起来,目标是推动AI在分级诊疗中的应用。

问:对这一段探索过程,最大的反思是什么?

王小川:最大的反思是不该同时开那么多条线。你要么做通用,要么做医疗,两只脚一块走是不行的。同时做商业、做技术、做医疗,一开始很难负担得住。

我们不是想取代医生

问:“百小医”为什么选择在微信里做AI医生bot?

王小川:Bot就是你微信上的一个朋友——你问他“该不该去医院”,他说不用,你先观察;过两天他会主动来问你“有没有变严重”,也会提醒你吃药,能够对个人和家庭健康进行主动和个性化的管理。

日常的健康管理不是一两次问诊能解决的,需要长期陪伴,传统的助手类APP很难承载这种持续性。

问:很多人可能会问,用百川的助手看病,和用其他通用AI助手(比如豆包)看病,体验差距大吗?

王小川:我们在专业性文献的引用、溯源上,会比通用AI助手更丰富。但坦白讲,无论是什么领域,单纯问答场景的体验很难形成断代式的差距。

真正的差异在产品形态和体验上。这次发布的“百小医”采用双端架构:APP端负责提供严肃的就医决策支持——针对病例、处方做分析报告和对比;微信bot端则负责日常的提醒和执行,这是一个会主动跟进你健康情况的AI医生。

另外,我们在底层做了一套永久性的记忆存储,不走传统的大模型上下文模式。这是一套有数据库结构的存储——用户上传的体检报告、对话里提到的症状病情、血压、用药情况都能被记录,实现全生命周期的健康数据管理。记忆能力在医疗场景特别重要,通用模型很多时候根本不知道该存用户的什么数据。

问:如果和同样是做医疗方向的“阿福”相比呢?

王小川:我们的切入点不一样。我们做的是主动管理——你问完之后,过两天它会微信上主动来问你“有没有更严重”,提醒你吃药、该复诊了。这种持续跟进的能力,App很难承载,用户一上手就能感觉到不同。

问:美国AI医疗赛道的头部公司OpenEvidence估值已经120亿美元了,他们做的是面向医生的AI临床决策支持工具,用顶刊论文辅助医生做诊疗判断。你们在中国能走这条路吗?

王小川:中国和美国的医疗市场有很大区别。给美国医生提效能直接多赚钱——他一天看10个病人变成看15个,这是保险公司付费的,按人头算,收入直接多50%。但中国医生平均一天看50-80个病人,已经够忙了,提效的空间几乎没有。

问:那在中国做AI辅助诊疗,动力在哪儿?

王小川:中国优质医疗供给现在是严重不足的。直接用通用AI助手给患者做咨询,很难进入医疗体系,还容易带来新的医患矛盾——今年已经有三甲医生和我反馈,30个病人里有25个都带着其他AI助手的结论来“对线”,会对医生产生质疑。

现在国家在倡导主动健康管理和强基层,如果AI能融入医疗体系、做分级诊疗的前置环节,这是政策认可的方向,也是新物种的机会。

问:百川是怎么提升医疗模型的智能的?

王小川:我们做的不是传统意义上的训练数据,更多是构建强化学习的评价体系。

医生标注的不是标准答案,而是帮我们建立奖励函数,构建评测集——什么样的提问路径最终能导向好的诊断结果。

问:听说你们请了很多医生做数据标注,这部分成本很高。

王小川:跟医生打交道做数据标注,真的很难。但主要不是钱的问题,是说服他们、建立评价体系、让团队跟他配合,这些都要摸索,没人做过。

问:既然是全新的做法,那一定也会有人反对吧?

王小川:不少人觉得在中国做医疗AI,就要跟医生合作,要用医生的病例数据造AI分身。

问:什么样的AI分身?

王小川:就是很多AI医疗公司的做法——跟某个顶尖医生合作,拿他的病例数据训练一个模型,本质上是复制这个医生的经验。肾病专家造个肾病模型,肿瘤专家造个肿瘤模型,每个人都想巩固自己的学术权威。但你见过一个医生用另一个医生做的AI吗?

问:你们的“造医生”和这种做AI分身有什么不同?

王小川:分身是模仿学习——把病例喂进去,让AI学着像某个医生那样看病。但你拿病例训出来的模型,它会提问吗?

这代大模型造的是“人”,不是上一代那种用来看CT片子的模式识别模型。我们走的是强化学习的路:模拟患者,激发模型提问,用最终的诊断结果做奖励函数,反向训练它该怎么提炼病例数据,问什么问题、该怎么推理。不是复制某一个医生,而是让AI学会医生思考的过程本身。

问:所以你们做的事情,本质上是把医生拉下神坛。

王小川:这是个危险的评价。我们不是要挑战医生的权威,而是要帮患者明明白白看病,以患者为中心,让他拥有更多的知情权和参与决策的权利。

问:面对医生,你怎么用一句话解释百小医的价值,来消解这种可能存在的对抗?

王小川:我说,我能帮你做随访。

这是一个共赢的场景:很多病人看完病,加上医生微信,回家之后问问题,等医生的回复往往要等到大半夜,因为医生太忙了。院后随访、复诊提醒、用药管理等等都是这样的场景,现在用AI医生就能帮医生分担这部分需求。

问:你们的目标用户是谁?

王小川:我们概括为“一老一小”——老人慢病多,小孩咨询多,这是最高频的场景。

比如,我把我妈和AI医生拉进一个群,AI医生跟我妈对话的时候,也同步跟我沟通。就像家里请个健康管家,不是只跟老人在一块,他也跟子女有交流。

医疗是条更慢的路?这是上一代的认知

问:很多人会说,医疗是一个反馈路径很长的赛道。先用通用模型赚到钱,再长期养医疗这条线,不是更稳妥吗?

王小川:我不接受这个叙事,这里面有很多误解。医疗慢,这是过去的经验形成的认知,不代表今天。

今天太多事情跟过去的规律不一样了。几个月时间,一个产品就能达到上亿用户、上亿收入的规模。那为什么我们还要用老的方式看待医疗?

百度三分之一的收入来自医疗,一天医疗相关的搜索量是上亿级别的。蚂蚁的“阿福”也有3000万月活了。需求一直在那里,只是以前可能是我们还没做好供给。

问:你们原来做To B、To G,到现在做To患者,这个变化是怎么发生的?

王小川:我确实有过很多反思,但我始终相信AI能造医生,这个信仰从第一天就刻在骨子里。我们在中间走过弯路,比如尝试先让医生认可,就做一个AI工具帮医生看片子、写论文;也试过做院内,先打进医院体系里,但这些路径都太长了。

大概去年4月我们就想清楚了,To患者才是我们的主线,这条路其实也是To医生。医生和患者,不过是有不同需求的C端用户。

问:比如挂号、买药,这些也是C端用户的刚需,你们会做吗?

王小川:帮你挂号、帮你买药,那些是执行,是上一代互联网干的事,偏匹配和链接。我们不是不能做,但核心还是想做决策——比如你有三个处方选哪个?去什么科室?要不要去医院?执行更直观、更有获得感,但帮你做选择判断是更难也更宝贵的事。

问:但蚂蚁做阿福,后续可以把挂号、卖保险、卖药联系起来,这样不会比你们在商业化上跑得更快吗?

王小川:他们是从“药”和“险”出发,补前面的问诊环节,而我们是从“医”这端开始切的。站在药的思路去做医,跟独立做医,立场不一样,做出来的东西也不一样。

问:短期内,你希望能够达到什么产品和业务上的目标?什么时候会考虑商业化?

王小川:第一步是“上岸”——去年还有朋友问“百川还活着吗?”得先让大家看到我们在做什么。第二步是在不同场景里积累技术口碑和用户体验的口碑。

商业化不是当下的重点。考虑早了,动作会变形。你看智谱到今天也不做那么多To B和To G了,大家都在卖Token。上一代常用的那套做法,现在反而变成了包袱。

语言模型、世界模型、生命模型

问:有媒体说你是“最孤独的AI创业者”,现在你会觉得孤独吗?

王小川:自己选的路跟大家不一样,你不就孤独吗?从资本到人才上都会变得更难。羊群效应决定了大家还是会选更主流的道路,这是正常规律。

问:你怎么看现在AI应用创业公司的处境?

王小川:在做模型之外,很多创业公司没啥可干的了。做Agent的公司,壁垒在哪?倒腾点Anthropic的Token,配置配置方案,今天能卖,明天能不能卖不知道。

不是说Agent没前途,而是它可能不是适合VC投的生意——赚小钱的公司很多,但长大变难了。

之前我和一个互联网大佬聊,他提到一个“去中化”的趋势——这个“中”是指中型公司。要么做巨头,要么做小而美的公司。

问:说到巨头,你去年初就公开说看好Anthropic,那时候Coding还没爆发,你的判断怎么来的?

王小川:我觉得是Dario(Anthropic CEO)对技术的理解很深刻,这是一种审美层面的判断。后来事实也验证了——Claude在代码场景里确实打出来了。

问:那其他呢,OpenAI你怎么看?

王小川:我觉得Anthropic和Google都会比它强。

问:你看到什么现象,让你有这个判断?

王小川:第一,Sam Altman还带着上一代互联网的思路——强推应用、追日活、做订阅,甚至Sora还想做社交。他的策略是应用大于模型本身,跟Anthropic不在一个技术审美上。

第二,做To C,Google会比OpenAI强。Google有搜索、有安卓、有YouTube,出口能力和数据能力都更好,我觉得Google以后会有代际的爆发和飞跃。

问:哪方面的爆发?

王小川:我觉得Google会走出新的架构——不只是语言模型代表的智力模型,还有物理模型、生命模型等等新路线。

其实Demis Hassabis(Google DeepMind CEO)的心头最爱就是生命模型,后来才转到LLM这个战场来的。

以后Google肯定既做语言模型,又做生命科学。一个公司能同时做AI、做无人驾驶、做蛋白质折叠——从人才储备、数据厚度、算力规模上,Google都是顶配。

问:所以,你对大模型演变的终局怎么看?

王小川:我们做模型有三步走。第一步是智力模型,就是语言模型——这里的语言包括数学语言和代码语言,代码很重要。第二步是物理模型,或者叫世界模型,做具身智能。第三步是生命模型,比材料科学更往前走——材料科学讲的还是简单世界,而生命有超越复杂性的终极问题。

生命模型是我从第一天就想做的事。这三条线最终会合流——理解语言、理解物理世界、理解生命系统,这才是完整的智能。

而且你想,工作开始被AI替代之后,人追求什么?创造发明发现、健康、快乐——最后就这三个事。长生不老、健康、每个人活得更有意义,这些问题最终都指向生命模型。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策