智象未来王科:B端隐形三年,借影视风口爆发在即
营收7亿元、亏损46亿元,市值却突破6200亿元——市场用一组反差极大的数字,将智谱华章推上“大模型第一股”的交椅。与此同时,一家AI视觉公司正从另一条赛道切入战场。成立仅三年的智象未来,选择了一条截然不同的技术路径。凭借自研的UiT架构(统一原生全模态架构),他们在文生图细分领域超越谷歌同级别模型,全球排名跃升至第三。这一技术突破及其背后的商业逻辑,值得逐层拆解。
“图像是通往世界模型的关键接口,也是技术博弈的核心战场。”智象未来联合创始人王科在专访中直接抛出这个判断。公司自研的UiT架构,跳出了传统扩散模型的路径依赖,通过不断优化的算法迭代,用极低的算力资源支撑起大模型训练。这一技术路线在2026年6月的全球第三方评测中得到了验证:他们的商用图像模型综合评分超越谷歌,成为国内首家达到这一水准的团队。王科透露,UiT架构的终极目标,是让AI能够统一理解文字、图片、视频及空间物理信息——这正是在为构建世界模型夯实根基。
在商业化路径上,智象未来做了清晰的选择:深耕B端。公司成立早期也讨论过C端战略,但团队最终决定将所有兵力押注在企业服务上。王科对此的看法是:“生成式AI的本质是生产力革命,B端能直接兑现降本增效的商业价值。”数据足以说明问题:公司目前拥有5000万C端用户,但他们的核心价值在于提供数据反馈,而非直接贡献利润。真正驱动营收增长的是B端服务——影视制作、商业营销、社交媒体内容创作。2025年,公司营收突破1亿元;到2026年,单季收入已超过上年全年。这种“隐形增长”策略,使他们在资本寒冬里连续完成两轮超6亿元融资,股东阵容涵盖国有产业基金、一线创投以及影视产业链企业。
影视行业成为智象未来技术落地的关键场景。王科提到一个关键细节:某专业短剧工作室已整体加入公司,意图深入拆解行业“know-how”。他们的AI视频生成工具,凭借“首尾帧控制”技术,将传统漫剧的制作成本压缩至原来的十分之一。更关键的是,最终成片效果几乎无法辨别是实拍还是生成。这种效率突破根植于中国影视生态的独特优势——全球最高的短视频渗透率、普通用户短剧消费习惯的深刻变革,为AI模型提供了海量训练数据和真实应用场景。
面对字节跳动Seedance 2.0等强劲对手,王科认为技术路线的差异将决定市场格局。“字节的模型深度整合了影视导演能力,非常契合中国社交媒体生态;而海外模型如Sora,受限于盈利空间和估值压力,最终选择退出。”他判断,视频类模型的竞争最终将聚焦于图像驱动的全模态能力。“未来必须实现任意模态的输入输出,图像模型是一条绕不开的路。”
在技术投入与盈利之间,智象未来选择了一条“克制迭代”的路径。他们的2000亿参数模型,靠优化算法架构降低算力消耗,而非盲目堆叠资源。“参数规模不是唯一衡量标准,模型稳定性与算力效率才是核心。”王科表示,公司当前亏损主要源于研发的持续投入,但已形成“模型迭代—产品优化—用户信任”的正向循环。对于行业流行的“赢家通吃”论调,他持反对态度:“AI是技术平权领域,各家基因不同,生态共建才是真正的壁垒。”
随着AI短剧和短视频营销市场的爆发,智象未来正在加速生态布局。其服务已覆盖头部电商平台、中小跨境商家及线下门店,同时通过软硬件一体化产品渗透营销全链条。王科坦言,目前还无法精确统计市场占有率,但签约收入已超过去年全年。“风口之下,子弹必须精准打在用户增长和价值创造上。”这是他当下阶段的判断。关键在于,在保持技术深耕的同时,商业策略的灵活性不能丢失。

