影眸科技Hyper3D获数亿元融资，3D生成进入智能时代

2026-06-23阅读 0热度 0

AI新闻

发布首月，订阅用户与ARR（年度经常性收入）的环比增速双双突破400%。

进入2026年，3D生成模型赛道迎来了集中爆发，竞争态势已趋白热化。

一季度，影眸科技率先推出行业首个3D编辑模型Rodin Gen-2 Edit，让AI 3D模型的可编辑性从概念走向现实；6月，VAST官宣新一轮融资，Meshy紧跟节奏，宣称发布全球首款3D AI Agent。密集的技术与资本动作，折射出这个赛道的高光时刻。

但竞争远未到终局。近期，这支起家于学术圈、创业早且团队极度年轻的3D模型团队——影眸科技，携最新一代模型成果及新一轮融资，再次搅动市场格局。

故事始于2020年。创始人兼CEO吴迪、联合创始人兼CTO张启煊，以及另外两位联合创始人张龙文、曾初啸，均来自上海科技大学。团队规模约60人，平均年龄不足25岁——年轻化程度在AI创业圈中极为罕见。

尽管团队年轻，影眸在B端市场的领跑地位却十分稳固。其B端客户数量及营收总和，超过了赛道内其他公司的总和。客户名单涵盖字节跳动、Unity、Figma、Canva等头部企业，海外收入占比高达80%。

学术层面的建树同样亮眼。影眸提出并定义了主流的原生3D生成方案CLAY，连续多年在计算机图形学顶级会议SIGGRAPH上获得最佳论文及提名。算法团队每两人中，就有一人拥有最佳论文获奖或提名经历。

据《智能涌现》获悉，影眸科技近日完成数亿元新一轮融资，由凯辉基金、上海国投先导领投，老股东持续跟投。在此之前，字节跳动、美团龙珠、红杉、蓝驰已相继入局。

伴随本次融资，影眸发布了最新一代3D生成模型——Hyper3D Rodin Gen-2.5，首次将语言模型的“先思考再生成”模式引入3D生成领域。该模型配备可调节的精度模式，是全球首个千万面级3D生成模型：最快4秒内生成百万面模型，并同步推出全球首个12K精度的原生3D贴图模型。

长期以来，影眸面向B端及专业C端，提供平台订阅、B端API服务、私有化部署、直接交付最终资产等多种形式，核心应用场景覆盖电商、3D打印、游戏、工业设计及具身智能等。

面对竞争，影眸的策略明确：主攻海外市场、聚焦专业C端用户、强化生成过程的可控性。

值得注意的是，Rodin Gen-2.5发布后，C端收入正逐步反超B端。上线首月，订阅用户与ARR的环比增速均超过400%。

C端的增长恰好回应了影眸最核心的命题：AI 3D是否真正被用户用起来了？

“从学术圈出来的人很容易陷入惯性，觉得自己技术强、论文厉害，市场为什么不用？但实际上，实验室产品与用户能实际使用的工具之间存在巨大鸿沟。”吴迪坦言。

要填补这一鸿沟，关键在于两点：生成的模型必须达到使用标准，用户必须能有效控制生成结果。

为此，影眸几乎在最大程度上赋予了用户编辑自由度。

平台上，用户可借助影眸自研的3D ControlNet，精准控制生成物件的长宽高及形状；生成的模型甚至第三方模型均可二次编辑——支持通过自然语言局部修改；同时还具备3D资产分件能力，且支持分级分件。

△影眸科技3D资产的分件能力，图源：企业官方

在影眸看来，这些看似繁琐、需要用户反复确认和控制的操作流程，恰恰构成了他们的核心价值。

“我们对3D生成的用户群体做过预估，大多数愿意付费的用户，恰好是对‘可控’有刚需的人。我们要优先服务真正会买单的用户。”张启煊表示，“3D生成的落地，已经从单纯追求观赏质量，迈向了可控性、效率与质量并重、更贴近实际生产的阶段。”

在预训练阶段内置可控性设计

经历元宇宙赛道收缩、2023年资金困境后，2024年原生3D生成方案CLAY的提出，彻底改变了影眸乃至整个3D生成赛道的走向。

当时，AI 3D行业几乎全部沿袭“2D升维3D”的技术路线——先生成物体多视角图像，再重建为3D资产。其痛点明显：存在不可逆的信息损耗，生成的模型很难在工业设计、游戏等场景中落地。

但影眸判断，生成的3D资产是否达到Production-Ready（生产就绪）才是决定性标准。因此，他们做了一个反直觉的决定：使用3D数据，从零训练3D原生模型。

这条此前无人踏足的路径，最终被验证可行。

2024年，影眸团队推出全球首个产品化的3D原生大模型框架CLAY，通过底层算法与框架创新，将3D生成效果从“不可用”提升至“可用”。该研究获得同年SIGGRAPH最佳论文提名。同年年中，基于CLAY架构，影眸发布了全球首个3D原生模型Rodin Gen-1。这也促使行业主流技术路线发生转向——越来越多的团队转向了3D原生路线。

影眸对其3D模型有两个核心要求：可控性与质量。

可控性是一张影眸主动打出的明牌。“对专业创作者而言，可控性至关重要，这是他们选择我们的首要原因。”张启煊说。实现可控性的关键在于，在预训练阶段就将相关设计融入模型底层。从Rodin的第一个版本起，影眸就引入了3D ControlNet等可控能力。

此后，影眸持续增强产品的可控性。支持局部修改模型、自动拆分不同部件、分件后再分件——这些能力都帮助用户降低“抽卡”频率，提高生成过程中的确定性。

Rodin Gen-2.5在3D生成领域首次引入类似LLM的Test-time Scaling（测试时缩放）策略。自适应的可调节Thinking Effort（思考力度），为未来实现与图像生成模型类似、与LLM深度结合提供了可能性。通过该策略，用户可选择模型的思考时间与深度。它支持五档思考深度，耗时从4秒到80秒，对应从快速草稿到高精度资产的生成。在Extreme-High模式下，模型可以达到千万面数的生成能力，精细还原皮肤微结构、纹理、毛孔等细节。

△Rodin-2.5的五档思考深度，图源：企业官方

此外，影眸推出了原生3D贴图模型。区别于传统投影法生成材质，该模型能够解决颜色断层、浸染等问题，清晰保留Logo、文字等信息。从几何生成到贴图，最快仅需5秒。该贴图模型具备图像生成级别的能力，实现材质纹理无死角覆盖，文字效果显著提升，支持基于物理的PBR材质。配合同步推出的12K原生3D贴图模型，生成效果在几何精度与材质保真度上，已可超越实景扫描——断层式领先行业水平。

另一个关键点——质量，影眸用一系列研究成果给出了证明。

自CLAY后，影眸相继推出CAST、BANG等研究成果。前者通过输入一张图片，即可生成包含物体及物体关系的完整3D场景；后者则实现对3D资产的分件。其中，关于CAST的研究论文《CAST：基于单张RGB图像的组件对齐式3D场景重建》斩获了SIGGRAPH 2025最佳论文奖。同期在该领域获得最佳论文的商业公司，仅有谷歌、Meta和影眸三家。

作为唯一连续多年获得SIGGRAPH最佳论文及提名的商业公司，影眸自2020年以来在顶级学术会议及期刊上累计发表30余篇论文，其中70%的科研成果已走向落地。这具体体现在产品的迭代节奏上：近两年间，影眸模型的四次重要迭代，从Rodin Gen-1，到2025年9月发布、具备拆件能力的Rodin Gen-2，再到2026年1月发布、具备局部编辑功能的Rodin Gen-2 Edit，直至今年6月最新发布的Rodin Gen-2.5。

谈到AI 3D的未来，吴迪表示，未来一至两年内，公司将坚持推进两件事：精进底层模型的生成质量，以及拓展编辑、Agent化等能力，让模型在专业领域越来越顺手好用。

服务最专业的用户，解决最真实的问题

AI 3D的商业化路径仍在被行业验证，但影眸认为这是一份可持续的好生意。

单看模型训练的算力成本，Rodin整数倍版本模型的迭代需要千卡级训练，但由于影眸在算法架构上的深厚积累，与同行训练同级别模型相比，其训练效率实现了大幅提升。

过去一年，企业级（B端）营收的质量与可持续性，正逐步取代消费级用户规模，成为衡量AI公司长期价值的核心维度——以Anthropic为代表的企业级路线，被广泛视为这一趋势的典型样本。影眸在收入端采取的就是类似策略，其积累的B端客户营收已超过同赛道其他公司的总和。

从客户侧看，影眸的B端订单分布在游戏、电商、工业设计、具身智能、空间计算等多个高价值场景。C端画像则主要是Pro-C（专业级消费者），如建模师、3D打印爱好者、产品设计师等。

在影眸团队看来，未来3-5年，3D生成的主要用户依然是专业人士。无论是语言模型、图像模型还是其他模型，都很难在绝对效果上完全分出高下。对3D生成赛道而言，大众真正关注的焦点是：模型厂商能否满足下游行业的需求。

“我们研发出来的东西，必须能接入到后期流程中使用。所以我们致力于做Production-Ready的产品，让它可以直接进入影视、游戏等场景的后期制作。”吴迪说。为此，影眸将产品设计成生成过程中可逐步确认、满意后再付费的模式。这一模式，源自对自身模型可用性的十足底气。

在影眸的客户列表中，不乏具身智能公司。它们使用影眸的3D资产作为训练数据，用于生成仿真环境和资产。

谈到赛道内正热的“世界模型”，张启煊指出，撕开世界模型的标签，大家主要在做两件事：一是实时视频生成，如Google的Genie-3；二是可仿真的环境，包括资产、模拟器等，以及面向自动驾驶、机器人策略的执行器。在世界模型版图中，影眸偏向于可仿真资产的生成。平台上已上线名为“Sim-Ready”的功能，用户点击后可直接在英伟达的仿真环境中进行物理仿真。

具身智能对3D生成模型的要求包括多个层面：一是物理反馈，如重量、碰撞体等——这些功能影眸已集成到产品中；二是可互动资产，例如3D资产在分件后如何实现动态交互——在这一方向上，影眸也产出了相关学术成果。

单纯依靠视频生成做世界模型，可能导致模型难以从视频中学习真实物理世界的维度关系。这正是3D的优势所在：能够理解物品之间的位置关系、视角角度连续性好、能在模型中进行物理模拟。

吴迪认为：“未来的世界模型，需要让机器真正学到与真实世界一致的场景，其背后很可能是3D生成与视频生成混合的模式。”

“3D生成的赛道正在收敛。而收敛意味着，最终只有少数真正解决了产业问题的团队，能留在牌桌上。过去一年，市场习惯用用户规模和增长曲线来衡量一家AI公司的价值。但3D生成会是游戏、影视、工业设计乃至物理世界智能化都绕不开的底层能力。我们服务最专业的用户，解决最真实的生产问题——这个选择决定了我们今天的领先，也决定了未来我们要去定义、而不只是参与下一代3D生产工具的规则。”

影眸科技Hyper3D获数亿元融资，3D生成进入智能时代

在预训练阶段内置可控性设计

服务最专业的用户，解决最真实的问题

相关阅读

最新教程

最新资讯