商汤SenseNova U1模型评测:原生理解生成一体化,告别插件时代
商汤科技于4月28日晚间开源了其“日日新SenseNova U1”系列模型。该系列被定义为“原生理解生成统一模型”,其核心突破在于摆脱了传统多模态模型依赖模块化拼接的技术范式,致力于从底层架构实现统一。
摒弃“拼接”逻辑,实现架构统一
传统多模态模型通常将视觉与语言模块分别训练后进行组合,这种拼接方式在跨模态信息对齐与转换过程中,易导致语义损失与效率瓶颈。
SenseNova U1系列基于商汤自研的NEO-unify架构,在单一模型框架内完成了多模态理解、推理与生成的深度融合。该架构构建了一个统一的表征空间,使得视觉与语言信号能够进行原生级的协同与互补。
从技术效果看,这种原生统一设计显著增强了模型对跨模态复杂场景的语义解析能力,同时在生成内容的连贯性与准确性上实现了同步优化。
轻量版率先开源,未来空间可期
商汤此次开源的是SenseNova U1 Lite轻量版,包含两种规格的模型权重,旨在为开发者提供兼顾性能与效率的灵活选择。模型已在主流开源平台发布。
轻量版开源是技术路线开放的第一步。据商汤规划,后续将释放参数规模更大、能力更完整的版本。这一原生统一架构的技术路径,为自动驾驶、具身智能及工业视觉等需要高精度跨模态理解的场景提供了新的解决方案,也预示着AI模型设计正从功能集成迈向底层架构的革新。