Z-Image中文AI生图模型:开源免费本地一键包评测
一款新工具正式上线了。Qwen 团队推出了全新图像生成与编辑模型,命名为 Z-Image。
用一句话概括这款模型的特点:体量小、响应快、画质佳、指令准。
通俗点讲——硬件门槛大幅降低,出图速度极快,画面效果出众,可控性很强,并且几乎没有额外限制。最后一点稍后会展开,这确实是真正的亮点。
讲再多不如实际跑一次。下面直接给出安装配置流程,需要一键包的用户请直接拉到文末。
1. 软件下载与升级
上手运行其实并不复杂。ComfyOrg 在第一时间提供了原生支持,只需下载最新版 ComfyUI,或对本地的旧版本进行升级,即可直接使用,无需额外安装第三方节点。
我本地已有 ComfyUI_windows_portable,因此选择了升级方案。
升级步骤很直观:打开 update 文件夹,找到三个脚本,双击 update_comfyui.bat。脚本会自动拉取最新代码并更新 Python 依赖项。前提是网络能正常访问外网环境。
如需全新安装,可查阅之前发布的详细教程,此处不再赘述。
2. 启动软件
升级完成后,双击 run_nvidia_gpu.bat 启动。启动后浏览器会自动打开,显示主界面。
3. 加载工作流
主界面默认加载上一次使用的工作流。我们需要切换到 Z-Image 的专属工作流——它已内置在软件中,直接在模板中选择 Z-Image-Turbo 即可。当前该模板排在首位,很容易找到。
4. 下载模型
打开工作流后,系统会提示模型缺失,不用惊慌。官方工作流自带模型下载链接,直接点击蓝色的下载按钮就能获取。下载完成后,按提示将模型放入 models 目录的对应位置。
本次仅涉及三个核心模型,操作极其简单。
另外,打开工作流后顶部可能会出现前端升级提示,通知 ComfyUI 界面已更新。可以点击试试,启用后的界面会更现代化。
5. 工作流简介
工作流看起来非常精简,只有两个节点:核心节点 Z-Image-Turbo Text to Image,以及常规的图片预览与保存节点。实际上,该工作流采用了子图结构,因此界面才如此清爽。
点击核心节点右上角的小图标,即可展开完整工作流。展开后稍显复杂,但本质流程很简单:
- Step 1:加载模型
- Step 2:设置图像尺寸
- Step 3:填写提示词
之后将所有内容输入 K 采样器,生成图片并展示。
本地没有模型时,节点会显示红色告警。等模型下载完毕并放置到位后,点击左上角菜单中的“编辑 → 刷新节点定义”,红色告警就会消失。
6. 运行生成
一切准备就绪后,点击右上角的运行按钮,等待出图即可。
测试机配置为 RTX 5060 Ti 16GB,该示例大约跑了一分钟。16GB 显存确实可以正常运行,但耗时与预期相差较大,同时图片中出现小字乱码现象。
经过简单测试发现,速度问题主要与参数设置有关,乱码则有一定随机性,调整图像比例后明显改善。
工作流默认使用 2048×2048 的巨大尺寸,改为 1024×1024 后,速度瞬间提升至 6~7 秒一张,已经非常可观。按常规杂志尺寸调整比例后,乱码问题基本消失。
优化后的设置测试了三个尺寸:
- 1200 × 1600 px(高清竖图)
- 1280 × 1700 px(杂志封面更宽松)
- 1500 × 2000 px(适合高品质输出)
结果都很理想,无明显问题。
此外还测试了 FP8 模型,显存占用基本在 8~9 GB 之间,最后生成瞬间占用略高。由于显存为 16 GB,系统会尽量多占用,因此 8 GB 显存配合内存应该也能运行。有 8GB 显卡的用户可以自行尝试。
目前已有 GGUF 格式的模型,预计能进一步降低显存消耗,网上有说法称 6 GB 也可运行。具体情况等待网友实测反馈——我手头没有低于 16 GB 的显卡,无法验证。
今天的目标是先让模型跑起来,后续再慢慢探索如何发挥其最大效能。
