对话王小川：通用AI之外，顶尖创业者的赛道选择与深度评测

2026-05-23阅读 0热度 0

人工智能

“如果没有转型，继续走主流道路，你也会有同等程度的焦虑。”王小川说。这次转型，让他真正回归到从创业第一天就最想做的事情：造AI医生。

一年前，百川智能进行了一次激烈的“大刹车”：大幅缩减通用模型团队，关闭金融等多条行业线，全面投入医疗大模型。与此同时，整个大模型行业却热闹非凡，大厂和创业公司轮番进行“轰炸式更新”——过去半年里，平均3天就有一个新版本的通用大模型面世。

看起来沉寂的百川在做什么？5月22日，王小川安静地交出了答卷：新一代医疗大模型M4，以及Agent产品“百小医”。

过去三年，百川的路径几经调整，从“要做中国最好的基础大模型”转向“同时押注多个落地场景”，再到“只做医疗”。团队规模不断缩小，部分合伙人离开，原定的上市节奏也因此延迟。

这看似颠簸的路走对了吗？在新产品发布前夕，王小川的状态反而更坦然了。“继续卷通用模型，走主流道路，那是一种选择。即使上市了很风光，但焦虑也不会减少半分。”比起当时公司内外巨大的不理解，以及选择非共识道路的孤独感，他更难以接受的是：“公司快成立两周年了，却不知道自己到底在干什么，创造什么价值。”

在互联网的上一个十年，医疗并不是一门“好生意”——商业化路径漫长，反馈周期动辄以年计。从大厂到初创公司，即使投入高达数十亿元，真正跑通产品市场匹配（PMF）的案例也寥寥无几，更别提获得商业上的巨大成功。

当时，很多公司的选择是给医生提效，或是打通挂号、买药、保险的链路，以此跑通商业闭环。但王小川认为，这些都不是当下最重要的事。他想明白了一点：百川的C端产品必须以患者为中心，目标是增加医生的有效供给，“我们要造更多的医生”。

在这个思路下，百川在医疗的B端场景中有了更多落地进展：在北京儿童医院，百川的两款AI儿科医生已在院内多学科会诊中正式“上岗”。在很多诊疗方案中，AI儿科医生与专家会诊结果的吻合率达95%，并开始向河北省150余家县级医院下沉。

在C端，新上线的Agent产品“百小医”则在App和微信生态中共同提供服务。“百小医”就像一个“AI家庭医生”，不只是提供问答，还会在患者就医前帮助梳理病情、分析处方、管理病例，甚至定时提醒用药和检查。

△图源：百川智能

王小川并不认同“医疗是更长、更慢的一条路”这个观点。“这个想法本身就是一种时代惯性。”他的逻辑是：如果Coding Agent能在几个月内成为史上增长最快的应用场景，就意味着很多旧的边界已经被打破。

从通用大模型的白热化竞争中抽身，All in医疗——对这个选择，王小川坦承，“我的选择不一定对，也不一定错。但可以确定的是，AI时代只要交付给用户足够重要的价值，商业化会是水到渠成的事。”

对于那些依然身处在同质化竞争中的AI公司来说，王小川的选择，至少是一条值得认真审视的路径：去找一个真正相信的问题，然后用足够长的时间回答它。

以下是经过整理的对话内容：

All in医疗有它的代价

问：今年年初发布了医疗大模型M3，今天又发布M4和新产品“百小医”，核心提升在哪里？

王小川：M4是我们的闭源医疗大模型，通过API提供服务。一个核心亮点是采用了Agent架构，从简单的对话走向临床，具备了基于患者全生命周期的记忆能力。

其他突破点有几个：幻觉减少、循证能力增强——我们把指南做了原子化拆解，甚至把专家共识也纳入进来；提问能力也有了很大提升——这对医疗场景很关键，每提升两个点的提问能力，就能增加一个点的诊断准确率。

现在，在肿瘤这类复杂场景里，M4能自己跑完整个Agent工作流——收集数据、校对冲突、调用基因变异数据库、出具诊断建议。它能够自主决策，针对不同的子项肿瘤情况，甚至可以主动查询基因库，做到像经验丰富的医生一样主动提问和管理。

“百小医”是新的To C产品，形态是App和微信上的一个智能体。它可以主动提供处方和病例分析，并做全周期的健康数据管理。

问：如何定义M4模型“做得好”？

王小川：在OpenAI发布的HealthBench测评集上，我们在Hard和Professional两个子集里都是表现最好的模型。我们没有对这个基准做特殊训练，所以模型表现好就是真的好。这个评测集有5000个医患多轮对话场景，262个人类医生编写了近5万条评价规则，不是靠刷榜能刷出来的。

问：当前行业最大的共识是押注Coding，百川却在一年前就选择不走通用模型路线，All in医疗。当时是怎么考虑的？

王小川：AGI的大叙事没问题，但这里面肯定有泡沫，泡沫褪去之后珍珠会留下来。怎么去找这个珍珠？大家会各自押注自己的生态位。做百川到现在，我想做的东西其实没什么变化——当初的初心就是做生命模型，造医生。ChatGPT的出现，反而是这个目标的助力。

我之前可能想得太早，又想得太远了。在2024年的时候你跟别人讲造医生、做生命模型，会发现理解的人不多。

问：但在那个时间点，不卷通用模型，是一种脱离主流赛道的选择。有过担忧吗？

王小川：如果选择主流，你也会有其他的恐惧。不是说我现在做得特别好，只是主流也有主流的问题，不同选择有各自的代价。

我们在2025年4月大调整后开始专注做医疗，也是因为当时临近百川成立两周年，我有巨大的紧迫感。当时公司摊子铺得特别大，从模型、医生到生命模型，再到商业化都在做。那种状态就是不知道自己在干嘛，在创造什么价值。

问：这个决定的代价是什么？

王小川：很多人在那个时候离开了。有同事觉得做通用模型才是对的道路，投资人也有不同意见。当时有各种曲解，比如有人传，小川可能对上市没想法，无所谓，反正自己财务自由了。

问：有些创业公司会选择先不考虑那么远，先赚到钱养活梦想，上市也是一种路径。

王小川：我们那个时候也不缺钱。问题是，上市了，然后呢？

问：百川的一些前高管，以及部分投资人，当时都很难理解这种突然的刹车。

王小川：当然可以想办法把年度经常性收入（ARR）、收入数据做起来，但在当时那也不是我最想要的。

第一，那样你就没精力深耕业务了，拿到收入和真正交付一个好的产品或服务，不是一个维度的事。第二，业务单点还没突破的时候，搞矩阵化管理是特别危险的事。当时销售、产品、技术，每个人身兼数职，为多个产品服务。

这种状态，和公司想实现的价值的判断是没法匹配的。如果从内心就不相信这个事情，也很难做好。

问：那怎么跟投资人解释？

王小川：很难解释。投资人肯定想上市，我只能继续把现在的事做好。

问：4月调整完之后，团队规模、架构，包括整体的工作方法有什么改变？

王小川：我们人数压缩到不超过300人，层级变得扁平，现在大概10多个人直接给我汇报。

现在主要分几大块：一是做医疗模型本身；二是以Agent的形态做AI医生产品；三是做医院体系的合作，通过AI医生，把医院、卫健委等体系联系起来，目标是推动AI在分级诊疗中的应用。

问：对这一段探索过程，最大的反思是什么？

王小川：最大的反思是不该同时开那么多条线。你要么做通用，要么做医疗，两只脚一块走是不行的。同时做商业、做技术、做医疗，一开始很难负担得住。

我们不是想取代医生

问：“百小医”为什么选择在微信里做AI医生bot？

王小川：Bot就是你微信上的一个朋友——你问他“该不该去医院”，他说不用，你先观察；过两天他会主动来问你“有没有变严重”，也会提醒你吃药，能够对个人和家庭健康进行主动和个性化的管理。

日常的健康管理不是一两次问诊能解决的，需要长期陪伴，传统的助手类APP很难承载这种持续性。

问：很多人可能会问，用百川的助手看病，和用其他通用AI助手（比如豆包）看病，体验差距大吗？

王小川：我们在专业性文献的引用、溯源上，会比通用AI助手更丰富。但坦白讲，无论是什么领域，单纯问答场景的体验很难形成断代式的差距。

真正的差异在产品形态和体验上。这次发布的“百小医”采用双端架构：APP端负责提供严肃的就医决策支持——针对病例、处方做分析报告和对比；微信bot端则负责日常的提醒和执行，这是一个会主动跟进你健康情况的AI医生。

另外，我们在底层做了一套永久性的记忆存储，不走传统的大模型上下文模式。这是一套有数据库结构的存储——用户上传的体检报告、对话里提到的症状病情、血压、用药情况都能被记录，实现全生命周期的健康数据管理。记忆能力在医疗场景特别重要，通用模型很多时候根本不知道该存用户的什么数据。

问：如果和同样是做医疗方向的“阿福”相比呢？

王小川：我们的切入点不一样。我们做的是主动管理——你问完之后，过两天它会微信上主动来问你“有没有更严重”，提醒你吃药、该复诊了。这种持续跟进的能力，App很难承载，用户一上手就能感觉到不同。

问：美国AI医疗赛道的头部公司OpenEvidence估值已经120亿美元了，他们做的是面向医生的AI临床决策支持工具，用顶刊论文辅助医生做诊疗判断。你们在中国能走这条路吗？

王小川：中国和美国的医疗市场有很大区别。给美国医生提效能直接多赚钱——他一天看10个病人变成看15个，这是保险公司付费的，按人头算，收入直接多50%。但中国医生平均一天看50-80个病人，已经够忙了，提效的空间几乎没有。

问：那在中国做AI辅助诊疗，动力在哪儿？

王小川：中国优质医疗供给现在是严重不足的。直接用通用AI助手给患者做咨询，很难进入医疗体系，还容易带来新的医患矛盾——今年已经有三甲医生和我反馈，30个病人里有25个都带着其他AI助手的结论来“对线”，会对医生产生质疑。

现在国家在倡导主动健康管理和强基层，如果AI能融入医疗体系、做分级诊疗的前置环节，这是政策认可的方向，也是新物种的机会。

问：百川是怎么提升医疗模型的智能的？

王小川：我们做的不是传统意义上的训练数据，更多是构建强化学习的评价体系。

医生标注的不是标准答案，而是帮我们建立奖励函数，构建评测集——什么样的提问路径最终能导向好的诊断结果。

问：听说你们请了很多医生做数据标注，这部分成本很高。

王小川：跟医生打交道做数据标注，真的很难。但主要不是钱的问题，是说服他们、建立评价体系、让团队跟他配合，这些都要摸索，没人做过。

问：既然是全新的做法，那一定也会有人反对吧？

王小川：不少人觉得在中国做医疗AI，就要跟医生合作，要用医生的病例数据造AI分身。

问：什么样的AI分身？

王小川：就是很多AI医疗公司的做法——跟某个顶尖医生合作，拿他的病例数据训练一个模型，本质上是复制这个医生的经验。肾病专家造个肾病模型，肿瘤专家造个肿瘤模型，每个人都想巩固自己的学术权威。但你见过一个医生用另一个医生做的AI吗？

问：你们的“造医生”和这种做AI分身有什么不同？

王小川：分身是模仿学习——把病例喂进去，让AI学着像某个医生那样看病。但你拿病例训出来的模型，它会提问吗？

这代大模型造的是“人”，不是上一代那种用来看CT片子的模式识别模型。我们走的是强化学习的路：模拟患者，激发模型提问，用最终的诊断结果做奖励函数，反向训练它该怎么提炼病例数据，问什么问题、该怎么推理。不是复制某一个医生，而是让AI学会医生思考的过程本身。

问：所以你们做的事情，本质上是把医生拉下神坛。

王小川：这是个危险的评价。我们不是要挑战医生的权威，而是要帮患者明明白白看病，以患者为中心，让他拥有更多的知情权和参与决策的权利。

问：面对医生，你怎么用一句话解释百小医的价值，来消解这种可能存在的对抗？

王小川：我说，我能帮你做随访。

这是一个共赢的场景：很多病人看完病，加上医生微信，回家之后问问题，等医生的回复往往要等到大半夜，因为医生太忙了。院后随访、复诊提醒、用药管理等等都是这样的场景，现在用AI医生就能帮医生分担这部分需求。

问：你们的目标用户是谁？

王小川：我们概括为“一老一小”——老人慢病多，小孩咨询多，这是最高频的场景。

比如，我把我妈和AI医生拉进一个群，AI医生跟我妈对话的时候，也同步跟我沟通。就像家里请个健康管家，不是只跟老人在一块，他也跟子女有交流。

医疗是条更慢的路？这是上一代的认知

问：很多人会说，医疗是一个反馈路径很长的赛道。先用通用模型赚到钱，再长期养医疗这条线，不是更稳妥吗？

王小川：我不接受这个叙事，这里面有很多误解。医疗慢，这是过去的经验形成的认知，不代表今天。

今天太多事情跟过去的规律不一样了。几个月时间，一个产品就能达到上亿用户、上亿收入的规模。那为什么我们还要用老的方式看待医疗？

百度三分之一的收入来自医疗，一天医疗相关的搜索量是上亿级别的。蚂蚁的“阿福”也有3000万月活了。需求一直在那里，只是以前可能是我们还没做好供给。

问：你们原来做To B、To G，到现在做To患者，这个变化是怎么发生的？

王小川：我确实有过很多反思，但我始终相信AI能造医生，这个信仰从第一天就刻在骨子里。我们在中间走过弯路，比如尝试先让医生认可，就做一个AI工具帮医生看片子、写论文；也试过做院内，先打进医院体系里，但这些路径都太长了。

大概去年4月我们就想清楚了，To患者才是我们的主线，这条路其实也是To医生。医生和患者，不过是有不同需求的C端用户。

问：比如挂号、买药，这些也是C端用户的刚需，你们会做吗？

王小川：帮你挂号、帮你买药，那些是执行，是上一代互联网干的事，偏匹配和链接。我们不是不能做，但核心还是想做决策——比如你有三个处方选哪个？去什么科室？要不要去医院？执行更直观、更有获得感，但帮你做选择判断是更难也更宝贵的事。

问：但蚂蚁做阿福，后续可以把挂号、卖保险、卖药联系起来，这样不会比你们在商业化上跑得更快吗？

王小川：他们是从“药”和“险”出发，补前面的问诊环节，而我们是从“医”这端开始切的。站在药的思路去做医，跟独立做医，立场不一样，做出来的东西也不一样。

问：短期内，你希望能够达到什么产品和业务上的目标？什么时候会考虑商业化？

王小川：第一步是“上岸”——去年还有朋友问“百川还活着吗？”得先让大家看到我们在做什么。第二步是在不同场景里积累技术口碑和用户体验的口碑。

商业化不是当下的重点。考虑早了，动作会变形。你看智谱到今天也不做那么多To B和To G了，大家都在卖Token。上一代常用的那套做法，现在反而变成了包袱。

语言模型、世界模型、生命模型

问：有媒体说你是“最孤独的AI创业者”，现在你会觉得孤独吗？

王小川：自己选的路跟大家不一样，你不就孤独吗？从资本到人才上都会变得更难。羊群效应决定了大家还是会选更主流的道路，这是正常规律。

问：你怎么看现在AI应用创业公司的处境？

王小川：在做模型之外，很多创业公司没啥可干的了。做Agent的公司，壁垒在哪？倒腾点Anthropic的Token，配置配置方案，今天能卖，明天能不能卖不知道。

不是说Agent没前途，而是它可能不是适合VC投的生意——赚小钱的公司很多，但长大变难了。

之前我和一个互联网大佬聊，他提到一个“去中化”的趋势——这个“中”是指中型公司。要么做巨头，要么做小而美的公司。

问：说到巨头，你去年初就公开说看好Anthropic，那时候Coding还没爆发，你的判断怎么来的？

王小川：我觉得是Dario（Anthropic CEO）对技术的理解很深刻，这是一种审美层面的判断。后来事实也验证了——Claude在代码场景里确实打出来了。

问：那其他呢，OpenAI你怎么看？

王小川：我觉得Anthropic和Google都会比它强。

问：你看到什么现象，让你有这个判断？

王小川：第一，Sam Altman还带着上一代互联网的思路——强推应用、追日活、做订阅，甚至Sora还想做社交。他的策略是应用大于模型本身，跟Anthropic不在一个技术审美上。

第二，做To C，Google会比OpenAI强。Google有搜索、有安卓、有YouTube，出口能力和数据能力都更好，我觉得Google以后会有代际的爆发和飞跃。

问：哪方面的爆发？

王小川：我觉得Google会走出新的架构——不只是语言模型代表的智力模型，还有物理模型、生命模型等等新路线。

其实Demis Hassabis（Google DeepMind CEO）的心头最爱就是生命模型，后来才转到LLM这个战场来的。

以后Google肯定既做语言模型，又做生命科学。一个公司能同时做AI、做无人驾驶、做蛋白质折叠——从人才储备、数据厚度、算力规模上，Google都是顶配。

问：所以，你对大模型演变的终局怎么看？

王小川：我们做模型有三步走。第一步是智力模型，就是语言模型——这里的语言包括数学语言和代码语言，代码很重要。第二步是物理模型，或者叫世界模型，做具身智能。第三步是生命模型，比材料科学更往前走——材料科学讲的还是简单世界，而生命有超越复杂性的终极问题。

生命模型是我从第一天就想做的事。这三条线最终会合流——理解语言、理解物理世界、理解生命系统，这才是完整的智能。

而且你想，工作开始被AI替代之后，人追求什么？创造发明发现、健康、快乐——最后就这三个事。长生不老、健康、每个人活得更有意义，这些问题最终都指向生命模型。

对话王小川：通用AI之外，顶尖创业者的赛道选择与深度评测

All in医疗有它的代价

我们不是想取代医生

医疗是条更慢的路？这是上一代的认知

语言模型、世界模型、生命模型

相关阅读

最新教程

最新资讯