智象未来图像大模型测评:两千亿参数与亿级融资背后的技术实力
大模型竞争的焦点,正从文本生成向视觉生成与物理世界理解演进。5月19日,智象未来在北京举办的首届开放日上,这一趋势得到了明确印证——公司正式发布了基于原生全模态架构的图像大模型HiDream-O1-Image-Pro。这个参数量超过2000亿的模型,已在多项核心基准测试中刷新了性能纪录。
同日,智象未来宣布完成新一轮亿级融资,深创投、金浦投资、财鑫资本、复聚资本等机构参与。这是公司半个月内完成的第二轮融资,资本市场对原生全模态技术路线的信心可见一斑。
原生全模态架构:突破“单模态拼接”瓶颈
原生全模态与常见的多模态模型有何本质区别?
HiDream-O1-Image-Pro采用了智象未来自研的统一Transformer架构。其核心在于,它将原始图像像素、文本标记及任务指令,统一映射到一个连续的共享表征空间进行处理。这意味着图像、文本与指令在模型底层实现了深度融合,而非简单的后期对齐或拼接。
这种架构设计,从根本上解决了传统多模态模型中模态隔离带来的语义鸿沟问题。其直接优势体现在模型性能上:在文生图、高保真文字渲染、复杂图像编辑等任务中,均达到了行业领先水平。
智象未来创始人兼CEO梅涛在开放日上阐释:“当前许多多模态大模型,本质仍是‘单模态拼接’。原生全模态,则是将物理世界的规则内化于模型——它理解空间关系、物理定律与因果逻辑。因此,它能真正地理解、推理并重构世界,而不仅仅是生成内容。”他认为,原生全模态是实现通用人工智能的关键路径。
该技术路线的可行性已获验证。智象未来联合创始人兼CTO姚霆指出,此前发布的开源版本HiDream-O1-Image,仅以8B参数就在权威评测平台Artificial Analysis的文生图榜单中位列开源模型第一,证明了UiT架构具备优秀的扩展性。此次发布的闭源Pro版本,参数量提升至两千亿级别,在复杂文本渲染、精细化指令编辑、多主体一致性生成等挑战性任务上,树立了新的性能标杆。
半月内再获融资,多元资本阵容成型
技术突破的背后,是资本的持续加注。半个月前,智象未来刚完成超5亿元融资,投资方包括安徽省产投、合肥产投、东方富海等。此次新一轮亿级融资的参与方,则新增了深创投、金浦投资、财鑫资本、复聚资本等机构。
至此,智象未来的股东结构呈现出多元协同的格局:既汇聚了安徽、上海、湖南等多地产业资本,也吸引了深创投、东方富海、峰华资本等头部市场化投资机构。这种“产业资本+财务投资”的组合,不仅提供了资金支持,更意味着公司在技术产业化落地方面获得了多维度的资源赋能。
公开信息显示,此次参与投资的金浦投资,其管理的上海金融发展投资基金在算力基础设施与大模型应用领域布局深入;财鑫资本长期专注于人工智能、具身智能等硬科技赛道;复聚投资则重点投资智能制造、新能源与AI等战略性新兴产业。这些投资方的专业领域,与智象未来的技术方向高度契合。
三大智能体加速商业化落地
前沿技术的价值最终需要通过市场应用来兑现。智象未来已形成“模型+智能体”双轮驱动的商业化战略,构建起“1+1+3”的业务架构。
具体而言,底层是HiDream系列大模型提供核心能力;中间层是HiHarness企业服务平台,负责能力标准化与工具化;上层则是直接面向三大场景的智能体应用:商业营销、影视创作和社媒创作。
目前,三大智能体已取得实质性进展。商业营销智能体HiBurst,其能力已覆盖跨境电商、内容营销等多个实战场景;影视创作智能体“帧赞”,累计制作的短剧内容时长已超5000分钟,入驻的专业团队超过千家;社媒创作智能体vivago近日登上了全球产品发现平台Product Hunt的日榜榜首,服务覆盖全球超100个国家及地区,用户数超过4000万。
技术落地离不开产业协同。在本次开放日上,智象未来宣布与上海电影集团上影新视野基金、蓝色光标、北京捷成世纪、倍尔健康等行业领军企业达成战略合作,共同推动大模型技术在影视制作、营销传播、医疗健康等领域的深度应用与产业融合。
从HiDream-O1-Image-Pro的发布,到三大智能体的规模化应用,智象未来的发展路径日益清晰:即以视觉生成为起点,逐步迈向对物理世界深度理解的“世界模型”。正如梅涛所言,公司将围绕原生全模态核心架构,持续推动底层模型、智能体平台与产业场景协同演进,向构建更完整、更智能的世界模型稳步迈进。
