智谱AI商业化进程深度解析:2024年关键策略与市场博弈
时间过得飞快,转眼又是一年。
2023年底,智谱AI的首席运营官张帆在北京搜狐网络大厦发出这样的感慨。自当年3月加入这家大模型领域的“当红炸子鸡”并负责商业化以来,他深切感受到,大模型不仅压缩了知识,更压缩了时间。最直观的体现是,在过去的九个月里,张帆以每月约见百家客户的速度,全力推进智谱的商业化进程。到2023年结束时,他的团队已拜访了上千家企业。
市场是最好的试金石,而来自竞争对手的敬畏或许是最高的褒奖。去年下半年,一位前互联网大厂副总裁就曾坦言,当他准备入局大模型创业时,仔细研究了智谱的市场步伐后,创业信心“直接打了九折”。原因很简单:当别人还在为技术从零起步时,智谱已经是一家运转起来的商业化公司了。
商业化,这道分水岭清晰地将智谱与国内多数大模型公司区分开来。早在2023年4月,张帆就曾预判,中国大模型的发展“上半年是融资战,下半年是价格战”。然而直到下半年,在To B与To G的赛场上,能真正参与角逐的身影依然寥寥,智谱是其中不容忽视的一个。
业界将智谱商业化的“激进”归因于上一代AI公司教训带来的投资压力,认为资本给予的盈利窗口期被大幅缩短。但这并非故事的全貌。纵观2023年,部分明星公司仍对外强调“聚焦技术打磨”。那么,智谱为何能更快地跑通商业化?核心原因或许可归结为两点:一是实力,二是洞见。
模型迭代速度是硬实力的体现。观察国内市场,能以平均每三个月一次的速度持续更新模型能力的公司,除了智谱,目前还难觅第二家。2023年,智谱在3月、6月、10月相继推出ChatGLM、ChatGLM2与ChatGLM3。进入2024年1月,新一代基座大模型GLM-4也已亮相。
商业节奏的把握则体现了前瞻性。一个常被忽略的细节是,智谱的商业团队从2023年3月就已开始组建,这为其后续的市场开拓赢得了宝贵的时间窗口。
过去一年,因聚焦大客户服务的To B、To G模式,智谱一度被外界视为“上一代视觉AI公司的翻版”。但经过一年的实践,故事出现了新的走向。得益于大模型技术本身的AGI(通用人工智能)特性,即便服务大客户,智谱的商业模式也呈现出本质不同。一位早期投资人的观点颇具启发性:“回顾过去的科技浪潮,未来五到十年,大模型的机会首先还是在基座。”
“谁说创业公司不能赚钱?”
2023年10月,在探讨大模型开源与商业化的平衡时,智谱AI CEO张鹏曾反问:“谁说创业公司不能赚钱?”
作为国内最早开源大模型的团队之一,智谱常被问及如何平衡“非盈利”的技术开源与“商业化”的模型销售。在张鹏看来,外界对学者创业的认知或许过于保守。事实上,商业化思考与开源精神一样,早已融入智谱的发展基因。
故事可以追溯到1996年成立的清华大学知识工程实验室(KEG)。团队从2006年起深耕大数据挖掘与知识图谱,并孵化了科技情报平台AMiner。随着AMiner日益成熟,商业化探索被提上日程。2019年6月,AMiner被拆分成立独立公司,这便是智谱AI的前身。
值得注意的是,智谱从成立第一天起就有收入,团队始终保持着“一边研究技术,一边开拓市场”的节奏。即便在研发重心仍集中于数据挖掘时,其客户已覆盖国内外科研机构、科技企业及互联网公司。用智谱AI总裁王绍兰的话说,“To B的基因从创立之初就已奠定。”
2020年6月OpenAI发布GPT-3,成为智谱发展的关键转折点。同年,团队毅然将研发重点转向语言大模型。2021年底至2022年,为了攻坚千亿参数大模型,智谱进入了商业化色彩最淡的时期。当时国内市场对大模型关注度不高,融资艰难,直至启明创投、君联资本与高瓴资本“冒险”反赌,智谱才得以在2022年8月研发出国内最早的千亿模型之一。
这意味着,智谱在融资和技术研发上,比多数同行领先了大约半年。正是这份先发优势,使得在ChatGPT横空出世后,智谱仅用两个月便推出了对标产品ChatGLM。
据熟悉内情的投资人透露,从2023年2月起,以张鹏为首的创始团队便展现出强烈的商业热情,早早提出了私有化部署与API服务的规划。也是从那时起,他们开始物色商业化负责人,最终邀请前大搜车CTO、连续创业者张帆加入,正式组建商业化团队。
到2023年11月中旬,这支团队已从十几人迅速扩张至上百人,建立了从售前、解决方案到售后的完整体系。指挥上,商业化被作为“一把手工程”推进,力求广泛覆盖行业,并在第二季度就完成了商业模式的初步探索。
私有化部署是智谱商业化的关键一步。这一更具中国特色的解决方案推出后,迅速受到行业客户欢迎。但也因历史上“私有化”常与“高度定制化”绑定,智谱一度被质疑是否会重走上一代AI公司的老路。
张帆对此的解释是,过去一年的实践表明,大模型的商业化路径已然不同。智谱提供的是标准化的通用大模型(GLM系列),各行各业的客户在此基础上进行微调,开发出满足自身需求的终端应用。换言之,智谱的通用大模型扮演的是数字化时代的“AGI中台”,是大模型时代的“基础模型提供商”。
关于AGI的产业层次,张鹏赞同一种三层模型划分:L0(基础模型)、L1(行业模型)、L2(细分场景模型)。后两者理论上都基于通用模型(L0)增强而来。智谱的战略很明确:集中全力做好L0,以此赋能合作伙伴和客户去构建L1和L2。
针对不同客户的需求,智谱梳理出四种主要商业模式:API调用、云端私有化、本地私有化,以及最底层的开源模型。这构成了一个清晰的金字塔体系:底层是拥有千万下载量的开源ChatGLM;之上是API服务层;再往上是面向中型企业的云端私有化,满足其数据安全与竞争壁垒需求;塔尖则是安全性要求极高的本地私有化部署。据悉,一些需求明确的小型项目,交付周期可缩短至一两周。
此外,智谱并非依靠单一模型打天下,而是构建了完备的模型矩阵:涵盖语言、代码、多模态模型;参数规模从开源的6B到商业化的12B、32B、66B、130B,乃至适用于手机、汽车等端侧的1.5B、3B轻量化模型;产品形态也包括对话产品ChatGLM与角色扮演CharacterGLM等。
从企业客户的角度看,与一家拥有完整模型矩阵的独角兽合作,意味着更低的综合选择与集成成本。
回顾科技发展史,浪潮的规律总是先基建、后应用。互联网始于芯片,芯片成熟后催生终端(PC),终端普及后孕育软件生态(如甲骨文),继而走向网络时代。若将AGI视为新一轮科技浪潮,那么在最初的五到十年,基座大模型无疑将是其中最蓬勃、最核心的市场。
大模型的数字价值
2024年3月14日,恰逢智谱发布千亿对话模型ChatGLM并开源ChatGLM-6B一周年。在这个节点上,智谱对外公布了一批商业化案例,不仅提交了一份“狂飙”式的成绩单,也验证了其商业化路径的前瞻性。
据张帆透露,过去一年,智谱的商业化进展远超预期,圈定了超过2000家生态合作伙伴,并与超过200家客户进行了深度共创。这份案例合集覆盖了智能汽车、金融、咨询、数字营销等多个领域,揭示了基座模型如何转化为实际生产力。
以数字营销领域的分众传媒为例。作为拥有中国最大户外媒体网络的公司,分众覆盖4亿城市主流消费人群。庞大的广告业务意味着海量的文案撰写工作,高度依赖人工,成本高、效率低。同时,销售人员收集和整理广告主产品信息的工作量巨大,且难以全面。
针对这些痛点,分众基于智谱大模型进行微调,开发了“众智AI”营销行业模型。仅使用了约5000条包含品牌、产品、广告文案的微调数据,模型便能根据输入的产品信息,输出符合分众广告风格的文案。
广告文案对基础模型的要求极高,需要模型已具备相关的语料学习基础,且广告语言本身要求严谨、精炼。经过测试对比,微调后的GLM模型生成的广告,在简练性、准确性和风格贴合度上,相较于GPT-4表现更优。
智能汽车是另一个大模型落地的重要场景。随着车控场景日益追求智能化,能与用户精准交互、提升体验成为核心卖点。上汽集团与阿里巴巴联手打造的高端智能电动车品牌——智己汽车,便基于智谱GLM系列基座模型和自身座舱数据,微调出“IM生成式大模型”。
传统车机系统对语音指令的理解局限较大,用户需使用明确指令。当表达更自由随意时,系统往往无法理解真实意图。GLM系列大模型通过AI技术,能够用更少的语料支持更多座舱意图,赋予车辆更准确的语音识别、更丰富的知识储备和更深度的语义理解能力,实现了座舱交互体验的整体升级。
金融领域同样是AI必争之地。华泰证券基于GLM系列大模型,叠加了40-50G金融专业书籍、资讯、法规、公告等数据进行增量训练,并结合投研、客服场景的上万条高质量指令进行微调,形成了“华泰金融大模型1.0”。该模型应用于智能客服场景后,相较于通用大模型效果提升10%~20%,展现出明显的领域优势。
华泰证券原有的运营模式基于传统知识库和模板引擎,虽已构建多场景客服体系,但仍存在产品孤立、意图识别泛化能力不足、缺乏多轮对话理解等问题。接入微调后的金融大模型后,其“涨乐财富通APP”的财富管理助手体验显著改善,实现了精准的意图识别、流畅的多轮交互和一站式服务能力。测试显示,智谱模型在多轮多意图语义理解和文档精准总结方面,能力居于国内外模型前列。
除了上述领域,智谱还与金山办公、蒙牛等互联网、传统制造业公司合作,通过模型私有化或API调用等方式,实现了GLM系列模型的广泛商用。客户反馈显示,选择智谱主要基于模型效果出色、安全性高,其领先的性能带来了更高的生成效率与准确性,最终驱动了用户增长与运营效率的提升。
后记
有观察者曾指出,智谱极有可能成为“中国大模型第一股”,因其在商业化速度、算力储备和生态建设三方面均显露出领先优势。
对于已取得的进展,CEO张鹏认为,智谱最大的特色在于从核心技术到商业化落地,始终秉持自主可控的理念,并坚持以生态合作的方式推进商业化。
然而,大模型赛道无人敢言松懈。即便强如智谱,也面临着持续的技术陡峭曲线。与上一代AI技术(如人脸识别达到90%+准确率即堪称里程碑)不同,大模型是“活”的,其能力边界仍在不断扩张。2024年初Sora的惊艳登场,以及OpenAI手中可能还有的“王炸”,都提醒着所有人,这场技术竞赛远未到终局。
在张鹏看来,智谱商业化面临的最大挑战,归根结底仍是技术本身。倘若真能达到GPT-4乃至GPT-5的水平,许多商业化难题(如效果、成本)将迎刃而解,商业模式甚至可能简化为直接提供API即可。
技术突破的背后是算力之争。说得直白些,谁的算力储备更雄厚,谁就更有可能训练出“中国的GPT-4”或“中国的Sora”。
张鹏预测,2024年对智谱而言将是挑战艰巨的一年。一方面,OpenAI在超级认知、超级对齐等领域可能取得新突破,要求智谱必须持续迭代,紧跟世界领先步伐;另一方面,大模型将迎来商业化落地潮,市场竞争势必加剧。
大模型的商业化之路,依然方兴未艾。
