阿里Wan2.7-Image评测:国内首屈一指的AI绘画模型深度解析
4月1日,阿里巴巴推出其图像生成与编辑统一模型Wan2.7-Image。该模型直接应对当前AI绘图领域的两大核心挑战:生成人像的“模式化”审美疲劳,以及输出色彩结果的不可控性。其设计目标聚焦于生成高度差异化、生动自然的人物肖像,并为用户提供专业级的色彩管理工具。
在功能架构上,Wan2.7-Image构建了从文生图、图生组图到图像指令编辑与交互式编辑的完整工作流。关键突破在于,其“文生图”能力在人类偏好盲测中的综合评分已超越GPT-Image1.5及国内其他主流竞品。在文本渲染精度、照片级真实感及世界知识理解等具体维度,其表现已接近Nano Banana Pro的水准。
图示:Wan2.7-Image在人类偏好盲测中位列国内模型首位。
告别“AI脸”:从骨相到眼眸的精细捏脸
为彻底解决生成人像的“塑料感”问题,Wan2.7-Image对虚拟形象生成进行了深度优化。模型支持从面部骨骼结构、眼型细节到五官特征的全面参数化定制。用户通过提示词调整相关参数,如指定脸型(鹅蛋脸、圆脸、方脸等)或眼部特征(杏仁眼、深眼窝、丹凤眼等),即可生成具备高度辨识度与真实感的面孔,有效实现“千人千面”的生成效果。
破解“色彩盲盒”:专业级调色盘功能
对设计师与视觉艺术家而言,色彩控制的精确性是核心需求,商业项目对配色方案更有严格规范。传统AI绘图在色彩输出上存在显著随机性。Wan2.7-Image内置的“调色盘”功能为此提供了解决方案。用户可通过Hex色值码一键提取参考图像的主色及占比,或直接输入自定义色值。无论是借鉴马蒂斯画作的浓郁红色、梵高作品的明艳黄色,还是毕加索时期的冷调蓝色,均可作为色彩基调生成同色系图像。用户还能精确控制画面中颜色的数量与比例,实现对最终配色方案的完全掌控。
印刷级文本渲染:告别文字模糊与错乱
在文本渲染任务中,尤其是处理长篇幅文字时,多数模型易出现字体模糊、内容错位或遗漏的问题。Wan2.7-Image凭借其长上下文文本编码器,能够精准解析超长字符序列。这使得其对长段落、表格乃至复杂数学公式的渲染都能达到印刷级清晰度。该功能支持12种语言,最高可处理3K tokens的文本输入,足以直接生成整页A4纸篇幅的文档内容。
全链路创作:从生成到精准编辑
除单图生成外,Wan2.7-Image具备强大的组图生成能力,可一次性生成最多12张风格统一的图像。这对于需要批量制作系列海报、PPT插图、分镜脚本、电商产品套图或多视角建筑渲染图的用户,能显著提升生产效率。
如果说生成是创作的起点,那么编辑则决定了作品的最终完成度。Wan2.7-Image原生集成了交互式编辑模块,其操作逻辑直观高效——通过精准框选目标区域,即可实现元素的添加、对齐、移动或Logo替换,达到像素级的意图对齐,让图像修改变得直接可控。
在多主体一致性控制方面,模型最高支持输入9张参考图像。无论是制作合影、电影海报,还是设计一套风格统一的家具组合图,都能确保所有元素在视觉风格与特征上保持高度协调。此外,在镜头视角控制、光影处理、材质参考、照片修复、虚拟试衣等数十种常用图像编辑任务上,Wan2.7-Image均能提供稳定可靠的输出,使创作过程摆脱随机性,结果更具可预测性。
技术内核:从“像素拟合”到“语义认知”
Wan2.7-Image的核心优势在于“理解”图像,其强大的认知能力源于模型架构与训练流程的多项创新。
在训练数据层面,模型构建了超大规模的异构数据底座,不仅覆盖全品类视觉素材,更整合了海量理解类数据。模型架构采用领先的生成与理解统一框架,通过共享隐空间实现文本与图像的语义映射,使模型无需“猜测”文本对应的视觉内容。训练中引入的多模态指令(文本+图像),推动了模型从单纯的“像素级拟合”向“深层语义认知”的关键演进。
在数据工程方面,团队依据图像布局、文本内容、光影、视角及应用场景等多个维度,构建了精细的多维标注体系。结合分阶段训练策略与多任务优化,确保了模型即使在长尾分布场景下也能保持极高的生成鲁棒性。值得一提的是,基于更大规模数据与参数训练的Wan2.7-Image-Pro也已同步发布,其在图像构图稳定性与语义理解精准度上表现更为卓越。
广阔的应用前景
Wan2.7-Image的强大多模态能力为各行业开辟了广泛的应用场景。对短剧及影视团队而言,其“千人千面”的捏脸系统与分镜生成能力,能以低成本完成角色设定、动作模仿与特效预览。自媒体与内容创作者可轻松生成多种风格的封面图或穿搭展示素材。在电商领域,凭借单张模特图即可衍生生成特写图、多场景卖点图,从而大幅降低实拍成本。教育及科研工作者可直接调用模型生成论文插图、信息图表乃至儿童绘本。针对当前热门的智能体应用,Wan2.7-Image现已支持Skill调用,使“AI智能体绘画”成为现实,全面拓展生成式模型的应用边界。
目前,用户已可通过官方渠道体验Wan2.7-Image,千问App也即将完成集成接入。