影眸科技Hyper3D获数亿元融资,3D生成进入智能时代
发布首月,订阅用户与ARR(年度经常性收入)的环比增速双双突破400%。
进入2026年,3D生成模型赛道迎来了集中爆发,竞争态势已趋白热化。
一季度,影眸科技率先推出行业首个3D编辑模型Rodin Gen-2 Edit,让AI 3D模型的可编辑性从概念走向现实;6月,VAST官宣新一轮融资,Meshy紧跟节奏,宣称发布全球首款3D AI Agent。密集的技术与资本动作,折射出这个赛道的高光时刻。
但竞争远未到终局。近期,这支起家于学术圈、创业早且团队极度年轻的3D模型团队——影眸科技,携最新一代模型成果及新一轮融资,再次搅动市场格局。
故事始于2020年。创始人兼CEO吴迪、联合创始人兼CTO张启煊,以及另外两位联合创始人张龙文、曾初啸,均来自上海科技大学。团队规模约60人,平均年龄不足25岁——年轻化程度在AI创业圈中极为罕见。
尽管团队年轻,影眸在B端市场的领跑地位却十分稳固。其B端客户数量及营收总和,超过了赛道内其他公司的总和。客户名单涵盖字节跳动、Unity、Figma、Canva等头部企业,海外收入占比高达80%。
学术层面的建树同样亮眼。影眸提出并定义了主流的原生3D生成方案CLAY,连续多年在计算机图形学顶级会议SIGGRAPH上获得最佳论文及提名。算法团队每两人中,就有一人拥有最佳论文获奖或提名经历。
据《智能涌现》获悉,影眸科技近日完成数亿元新一轮融资,由凯辉基金、上海国投先导领投,老股东持续跟投。在此之前,字节跳动、美团龙珠、红杉、蓝驰已相继入局。
伴随本次融资,影眸发布了最新一代3D生成模型——Hyper3D Rodin Gen-2.5,首次将语言模型的“先思考再生成”模式引入3D生成领域。该模型配备可调节的精度模式,是全球首个千万面级3D生成模型:最快4秒内生成百万面模型,并同步推出全球首个12K精度的原生3D贴图模型。
长期以来,影眸面向B端及专业C端,提供平台订阅、B端API服务、私有化部署、直接交付最终资产等多种形式,核心应用场景覆盖电商、3D打印、游戏、工业设计及具身智能等。
面对竞争,影眸的策略明确:主攻海外市场、聚焦专业C端用户、强化生成过程的可控性。
值得注意的是,Rodin Gen-2.5发布后,C端收入正逐步反超B端。上线首月,订阅用户与ARR的环比增速均超过400%。
C端的增长恰好回应了影眸最核心的命题:AI 3D是否真正被用户用起来了?
“从学术圈出来的人很容易陷入惯性,觉得自己技术强、论文厉害,市场为什么不用?但实际上,实验室产品与用户能实际使用的工具之间存在巨大鸿沟。”吴迪坦言。
要填补这一鸿沟,关键在于两点:生成的模型必须达到使用标准,用户必须能有效控制生成结果。
为此,影眸几乎在最大程度上赋予了用户编辑自由度。
平台上,用户可借助影眸自研的3D ControlNet,精准控制生成物件的长宽高及形状;生成的模型甚至第三方模型均可二次编辑——支持通过自然语言局部修改;同时还具备3D资产分件能力,且支持分级分件。
△影眸科技3D资产的分件能力,图源:企业官方
在影眸看来,这些看似繁琐、需要用户反复确认和控制的操作流程,恰恰构成了他们的核心价值。
“我们对3D生成的用户群体做过预估,大多数愿意付费的用户,恰好是对‘可控’有刚需的人。我们要优先服务真正会买单的用户。”张启煊表示,“3D生成的落地,已经从单纯追求观赏质量,迈向了可控性、效率与质量并重、更贴近实际生产的阶段。”
在预训练阶段内置可控性设计
经历元宇宙赛道收缩、2023年资金困境后,2024年原生3D生成方案CLAY的提出,彻底改变了影眸乃至整个3D生成赛道的走向。
当时,AI 3D行业几乎全部沿袭“2D升维3D”的技术路线——先生成物体多视角图像,再重建为3D资产。其痛点明显:存在不可逆的信息损耗,生成的模型很难在工业设计、游戏等场景中落地。
但影眸判断,生成的3D资产是否达到Production-Ready(生产就绪)才是决定性标准。因此,他们做了一个反直觉的决定:使用3D数据,从零训练3D原生模型。
这条此前无人踏足的路径,最终被验证可行。
2024年,影眸团队推出全球首个产品化的3D原生大模型框架CLAY,通过底层算法与框架创新,将3D生成效果从“不可用”提升至“可用”。该研究获得同年SIGGRAPH最佳论文提名。同年年中,基于CLAY架构,影眸发布了全球首个3D原生模型Rodin Gen-1。这也促使行业主流技术路线发生转向——越来越多的团队转向了3D原生路线。
影眸对其3D模型有两个核心要求:可控性与质量。
可控性是一张影眸主动打出的明牌。“对专业创作者而言,可控性至关重要,这是他们选择我们的首要原因。”张启煊说。实现可控性的关键在于,在预训练阶段就将相关设计融入模型底层。从Rodin的第一个版本起,影眸就引入了3D ControlNet等可控能力。
此后,影眸持续增强产品的可控性。支持局部修改模型、自动拆分不同部件、分件后再分件——这些能力都帮助用户降低“抽卡”频率,提高生成过程中的确定性。
Rodin Gen-2.5在3D生成领域首次引入类似LLM的Test-time Scaling(测试时缩放)策略。自适应的可调节Thinking Effort(思考力度),为未来实现与图像生成模型类似、与LLM深度结合提供了可能性。通过该策略,用户可选择模型的思考时间与深度。它支持五档思考深度,耗时从4秒到80秒,对应从快速草稿到高精度资产的生成。在Extreme-High模式下,模型可以达到千万面数的生成能力,精细还原皮肤微结构、纹理、毛孔等细节。
△Rodin-2.5的五档思考深度,图源:企业官方
此外,影眸推出了原生3D贴图模型。区别于传统投影法生成材质,该模型能够解决颜色断层、浸染等问题,清晰保留Logo、文字等信息。从几何生成到贴图,最快仅需5秒。该贴图模型具备图像生成级别的能力,实现材质纹理无死角覆盖,文字效果显著提升,支持基于物理的PBR材质。配合同步推出的12K原生3D贴图模型,生成效果在几何精度与材质保真度上,已可超越实景扫描——断层式领先行业水平。
另一个关键点——质量,影眸用一系列研究成果给出了证明。
自CLAY后,影眸相继推出CAST、BANG等研究成果。前者通过输入一张图片,即可生成包含物体及物体关系的完整3D场景;后者则实现对3D资产的分件。其中,关于CAST的研究论文《CAST:基于单张RGB图像的组件对齐式3D场景重建》斩获了SIGGRAPH 2025最佳论文奖。同期在该领域获得最佳论文的商业公司,仅有谷歌、Meta和影眸三家。
作为唯一连续多年获得SIGGRAPH最佳论文及提名的商业公司,影眸自2020年以来在顶级学术会议及期刊上累计发表30余篇论文,其中70%的科研成果已走向落地。这具体体现在产品的迭代节奏上:近两年间,影眸模型的四次重要迭代,从Rodin Gen-1,到2025年9月发布、具备拆件能力的Rodin Gen-2,再到2026年1月发布、具备局部编辑功能的Rodin Gen-2 Edit,直至今年6月最新发布的Rodin Gen-2.5。
谈到AI 3D的未来,吴迪表示,未来一至两年内,公司将坚持推进两件事:精进底层模型的生成质量,以及拓展编辑、Agent化等能力,让模型在专业领域越来越顺手好用。
服务最专业的用户,解决最真实的问题
AI 3D的商业化路径仍在被行业验证,但影眸认为这是一份可持续的好生意。
单看模型训练的算力成本,Rodin整数倍版本模型的迭代需要千卡级训练,但由于影眸在算法架构上的深厚积累,与同行训练同级别模型相比,其训练效率实现了大幅提升。
过去一年,企业级(B端)营收的质量与可持续性,正逐步取代消费级用户规模,成为衡量AI公司长期价值的核心维度——以Anthropic为代表的企业级路线,被广泛视为这一趋势的典型样本。影眸在收入端采取的就是类似策略,其积累的B端客户营收已超过同赛道其他公司的总和。
从客户侧看,影眸的B端订单分布在游戏、电商、工业设计、具身智能、空间计算等多个高价值场景。C端画像则主要是Pro-C(专业级消费者),如建模师、3D打印爱好者、产品设计师等。
在影眸团队看来,未来3-5年,3D生成的主要用户依然是专业人士。无论是语言模型、图像模型还是其他模型,都很难在绝对效果上完全分出高下。对3D生成赛道而言,大众真正关注的焦点是:模型厂商能否满足下游行业的需求。
“我们研发出来的东西,必须能接入到后期流程中使用。所以我们致力于做Production-Ready的产品,让它可以直接进入影视、游戏等场景的后期制作。”吴迪说。为此,影眸将产品设计成生成过程中可逐步确认、满意后再付费的模式。这一模式,源自对自身模型可用性的十足底气。
在影眸的客户列表中,不乏具身智能公司。它们使用影眸的3D资产作为训练数据,用于生成仿真环境和资产。
谈到赛道内正热的“世界模型”,张启煊指出,撕开世界模型的标签,大家主要在做两件事:一是实时视频生成,如Google的Genie-3;二是可仿真的环境,包括资产、模拟器等,以及面向自动驾驶、机器人策略的执行器。在世界模型版图中,影眸偏向于可仿真资产的生成。平台上已上线名为“Sim-Ready”的功能,用户点击后可直接在英伟达的仿真环境中进行物理仿真。
具身智能对3D生成模型的要求包括多个层面:一是物理反馈,如重量、碰撞体等——这些功能影眸已集成到产品中;二是可互动资产,例如3D资产在分件后如何实现动态交互——在这一方向上,影眸也产出了相关学术成果。
单纯依靠视频生成做世界模型,可能导致模型难以从视频中学习真实物理世界的维度关系。这正是3D的优势所在:能够理解物品之间的位置关系、视角角度连续性好、能在模型中进行物理模拟。
吴迪认为:“未来的世界模型,需要让机器真正学到与真实世界一致的场景,其背后很可能是3D生成与视频生成混合的模式。”
“3D生成的赛道正在收敛。而收敛意味着,最终只有少数真正解决了产业问题的团队,能留在牌桌上。过去一年,市场习惯用用户规模和增长曲线来衡量一家AI公司的价值。但3D生成会是游戏、影视、工业设计乃至物理世界智能化都绕不开的底层能力。我们服务最专业的用户,解决最真实的生产问题——这个选择决定了我们今天的领先,也决定了未来我们要去定义、而不只是参与下一代3D生产工具的规则。”

