最新融资榜：VAST获2亿美元A轮融资，推出世界模型

2026-06-01阅读 0热度 0

世界模型

近日，通用人工智能公司VAST宣布完成A+及A++两轮融资，合计金额近2亿美元。本轮由渶策资本、国寿长三角科创基金领投，深圳市人工智能终端产业基金（产业方为全球头部终端厂商荣耀）、知名产业战投、上海半导体产投等产业投资方，以及深创投、元生资本、沃赋创投与方广资本等一线财务资本联合投资。值得注意的是，春华创投、靖亚资本、BV百度风投、东方嘉富等老股东也持续超额追投。这是VAST继今年3月融资后，时隔两个月再度获得资本加持。

与融资消息同步揭晓的，是VAST全新的世界模型项目——Project Eden（代号：伊甸园）。

这个项目的技术路径，与业内主流的“动作条件视频生成”或“静态3D场景生成”截然不同。Project Eden创造性地将底层状态推演与视觉呈现进行了原生解耦。这一突破使其成为全球首个允许对世界状态进行自主维护与确定性控制的世界模型，并且自然解锁了环境长程持久、场景自由复用、多人并发交互等此前难以兼顾的能力。简而言之，Project Eden的目标是成为下一代低门槛交互式内容创作的底层引擎，同时为具身智能等智能体提供具备高逻辑一致性的训练与评测环境。

本轮资金将主要用于AI 3D大模型、通用世界模型的顶尖人才引进、核心算法迭代与数据积累，同时加速全球市场布局与产业生态建设。这次融资，既是对VAST技术路线与商业化成果的直接认可，也折射出产业界对通用世界模型长期价值的判断。

01 Project Eden：一个环境永续、多人互动的世界模型

大语言模型预测下一个单词，视频模型渲染下一帧画面，而世界模型的核心使命，是推演世界的下一个状态——基于现有环境与用户动作，模拟世界随之产生的全部变化。

这意味着，一套合格的通用世界模型，必须同时解决两大核心命题：第一，定义世界当下的客观状态；第二，驱动世界持续自主演化。

对VAST而言，所有技术布局的终极目标始终是：让每个人都能亲手创造、自由探索无数个可交互的世界。要实现这一点，必须攻克几个底层难题——环境长程记忆、多人与智能体并发交互，以及在工程上能够低成本且可规模化落地。

目前业内主流的两条技术路线，都难以同时满足“创造世界”和“在持续交互”的完整需求。第一种是动作条件视频生成：它仅根据有限空间的输入动作做短时画面预测，将世界状态隐性压缩在有限帧画面内。一旦物体脱离相机视野，模型就只能凭空推演，无法实现长时序状态留存，也难以支撑多人在同一世界中的协同共存。第二种是静态3D场景生成：这类方案能搭建可游览的三维空间，但剥离了时间维度与物理运行逻辑，不存在状态迭代机制，自然无法支撑动态交互。

基于此，Project Eden采用三层解耦式技术架构，跳出像素生成的固有框架：

底层为结构化状态层：搭建可长期演化的3D底层基座，统一维护场景几何结构、物体身份属性与全局事件逻辑，承载世界的客观状态与自主推演。
中间为条件接口层：作为状态与渲染的转换枢纽，依据不同相机视角，将完整的底层3D状态转化为适配生成任务的语义、几何条件约束。所有视角渲染均同源同一底层世界，从根源上保障跨镜头、跨视角的物理一致性。
上层为生成式渲染层：依托底层客观状态与中间层约束条件，按需实时渲染精细化视觉画面，补足动态细节，面向用户输出直观的沉浸式体验。

依托状态推演与视觉渲染的原生解耦架构，Project Eden在全球范围内率先将世界状态转化为可长效留存、反复编辑、多人共享的独立运行体，进而解锁了三大核心能力：

环境长程持久：世界状态独立于相机视角并永久存储，不受画面切换、用户离场影响。通过底层状态查询保障时空一致性，支持用户在场景内长时间连续漫游，彻底解决了物体消失、场景畸变等行业顽疾。
场景自由复用：支持对世界底层状态进行读写与动态干预，用户在场景内的所有行为都会被真实留存。比如用户对场景物体做出破坏、改造等操作后，后续进入该场景的其他用户，均可看到完全一致的变更结果。无需重复生成场景，实现全域状态延续与高效复用。
多人交互并发：状态演化与渲染流程相互解耦，单一底层世界可同时承载大量真人用户与AI智能体多并发在线交互。区别于传统方案算力随视角/人数指数增长的弊端，这套架构的算力成本可控，不仅支撑大规模社交互动、大型在线内容生态搭建，更是集群式具身智能训练、多智能体协同研究的关键底座。

Project Eden的定位，是下一代交互式内容创作的底层引擎，同时也是适配具身智能训练的高质量仿真基座，覆盖互动内容与科研两大核心场景：面向互动内容，提供环境生成和交互逻辑构建的一站式能力；面向科研领域，提供具备完整物理规则、长时序一致性、可自由干预的仿真环境。

02 不断刷新3D大模型SOTA，与行业拉开代际差距

过去三年，VAST在AI 3D领域持续稳居算法SOTA。自研的Tripo系列3D大模型，每一次迭代都是行业标杆。

2026年3月正式上线的Tripo H3.1、Tripo P1.0模型，持续保持行业断层式领先：前者以雕塑级几何细节刷新了AI 3D的精度天花板；后者是全球唯一能在数秒内输出生产级网格的3D大模型，较市面其他方案提速百倍。模型层的持续突破，让VAST具备了将3D资产从“可看”推向“可用、可交互、可演化”的底层条件。

算法迭代还在加速。近期，Tripo Studio上线了两项新突破：

8K贴图：每一个细节都经得起审视

Tripo 8K贴图是业内首款原生8K AI贴图算法。新的AI贴图精度已突破人眼分辨极限，让3D资产实现全距离无损呈现：近距离特写无破绽，极致放大依然清晰。依托该算法，3A渲染画质与电影级细节均可由AI原生呈现。

长久以来，8K贴图是高端3D资产的专属配置。资深贴图师手工绘制需3至5天，实地扫描材质并投射至模型也需2至3天，单张成本高达500至2000美元。VAST将整套流程压缩至2分钟以内，单张边际成本近乎为零。技术层面，该功能采用原生多通道同步生成，全维度材质均达8K分辨率，产出资产可直接接入Unreal、Unity、Blender等专业管线，无需二次修复。

Segmentation V2：更精准、更可控的智能部件拆分

2025年5月，VAST在Tripo Studio Beta上线了业内首个智能部件拆分功能。时隔一年推出的Segmentation V2，依托升级后的多模态3D结构理解模型与部件命名映射机制，打造精度更高、操控性更强的拆分能力。

升级后的V2在执行3D拆分前，会先生成2D预拆分图供用户预览；同时引入三档颗粒度控制，对应不同下游场景的实际需求：

低（3-6个部件）：面向3D打印、概念展示等以主体结构为主的场景；
中（6-15个部件）：对应游戏开发与影视制作管线中常见的装配件粒度；
高（15+个部件）：面向精细模组、机械结构、可拆卸玩具等高度细分的资产。

对于3D打印行业而言，结合同期上线的快速补全功能，“生成—分件—补全—打印”的全流程被进一步压缩。

引领前沿研究，共建开源生态

在VAST，开源不是技术外溢的附属选择。3D作为人机共通的空间语言，其底层基础设施理应在公开协作中搭建。

2024年3月，VAST携手Stability AI联合开源TripoSR，率先将单图3D生成速度压缩至0.5秒级别。2025年3月推出第二季开源计划，陆续释放TripoSG、TripoSF、UniRig、HoloPart等八大项目。如今，VAST第三季开源计划正式收官，聚焦动态互动内容：

与清华大学联合开源TripoSplat：革新3D高斯密度控制逻辑，采用可学习概率采样机制，让模型自主完成算力动态调配。
与香港大学联合开源AniGen：单图一键生成可动画3D资产，在统一模型内完成几何、纹理、骨架与蒙皮生成。
与清华大学联合开源SkinTokens：业界首次将蒙皮权重转化为Token形式，在同一自回归框架下完成骨骼与蒙皮联合生成。
LegoACE：支持文本、图像双输入，逐块自回归生成可物理拼装的乐高模型。

历经三年深耕，VAST累计对外开源项目超30个，覆盖从基础表征到生成管线的完整技术栈。

持续降低创造世界的门槛，让更多人拥有对互动内容的选择权与体验权，是VAST三年来所有技术、产品、生态与商业决策的出发点。

《创世记》里，人类因偷食禁果被逐出伊甸园。整个西方文明叙事的开端，是一次人类的好奇心被惩罚——在创世之初，求知本身就要付出代价。Project Eden想要改写这个开端：世界可以拥有成千上万座花园，朝着无需批准的方向恣意生长，结出无数种果实，等待所有人采摘和品尝。

阿根廷作家博尔赫斯在《小径分岔的花园》中描绘过一座时间迷宫：时间不断分岔，所有人生与世界的可能性在其中并行共存。VAST正在为这座花园培育土壤、播撒种子。

这座花园没有围墙。

VAST 斩获近2亿美元A轮系列融资，同步推出世界模型，顶级财投和产业资本鼎力入局

最新融资榜：VAST获2亿美元A轮融资，推出世界模型

01 Project Eden：一个环境永续、多人互动的世界模型

02 不断刷新3D大模型SOTA，与行业拉开代际差距

8K贴图：每一个细节都经得起审视

Segmentation V2：更精准、更可控的智能部件拆分

引领前沿研究，共建开源生态

相关阅读

最新教程

最新资讯