OpenClaw 图像生成高频技能推荐:4个必用Skills精选
OpenClaw 图像生成技能(Image Generation Skills) 是专为 OpenClaw Agent 设计的扩展模块,赋予其文生图能力。安装后,Gemini、DALL-E、Flux、即梦等主流图像 API 均可通过自然语言直接调用。整个过程无需退出终端,直接在命令行中完成 AI 图像生成。
OpenClaw 能否直接生成图片?
可以。但 OpenClaw 自身并未内置绘画功能。作为 AI Agent 框架,它通过加载“图像生成 Skills”调用外部图像 API,从而在对话中直接输出图片。
逻辑流程如下:
- 用户通过自然语言描述需求(例如:「帮我生成一张产品封面图」)。
- OpenClaw 自动识别图像生成意图,并激活对应技能扩展。
- 技能模块调用已配置的图像 API(如 Gemini、DALL-E、Flux 等)生成图片。
- 最终图片保存至本地或返回 URL 链接。
图像生成的价值在于它可以与其他工作流无缝联动。例如:先分析报告,自动生成配图,再直接发送到飞书——内容生产完整闭环一气呵成。这正是其核心价值。
4 个高频图像生成技能推荐
1. Gemini 图像生成技能(gemini-image)
适用场景:通用文生图、图像编辑、参考图改写
Gemini 3 Pro Image 在 OpenClaw 生态中集成度最高,稳定可靠。以官方示例 nano-banana-pro 为代表,该技能在 GitHub 社区累计获得 1,300+ star,是 OpenClaw 图像技能中热度最高的方向之一。
核心能力:
- 文生图:依据文字描述生成高质量图像。
- 图像编辑:基于参考图片修改局部内容。
- 风格迁移:将内容转换为特定视觉风格。
- 多轮对话式调整:支持动态修改,例如“把背景换成白色”。
触发示例:
"生成一张科技感产品封面图,蓝色调"
"将这张图的背景替换为纯白色"
"使用水彩风格重新绘制此示意图"
安装:
openclaw skills install gemini-image
配置:
{
"skills": {
"entries": {
"gemini-image": {
"enabled": true,
"env": {
"GEMINI_API_KEY": "your_gemini_api_key"
}
}
}
}
}
2. DALL-E / gpt-image-1 技能(openai-image)
适用场景:内容营销配图、精准提示词控制、电商图片生成
OpenAI 系列在提示词遵循度方面表现卓越。特别是 2025 年发布的 gpt-image-1,支持对话式图像生成,能结合上下文理解复杂指令。若追求精细控制,该方向是首选。
核心能力:
- 高精度提示词响应,复杂描述理解能力优秀。
- 支持多种输出尺寸(正方形、横版、竖版)。
- 内建安全过滤机制,适用于商业内容生产。
- 支持局部重绘(Inpainting)。
触发示例:
"生成一张电商产品主图,白底,俯视角"
"画一张信息图,展示四个步骤的流程"
"为这篇文章生成一张横版封面图"
安装:
openclaw skills install openai-image
配置:
{
"skills": {
"entries": {
"openai-image": {
"enabled": true,
"env": {
"OPENAI_API_KEY": "your_openai_api_key"
}
}
}
}
}
3. Flux 图像生成技能(flux-image)
适用场景:高质量艺术图、写真风格、开源模型偏好用户
Flux 1.1 Pro 由 Black Forest Labs 开发,采用 120 亿参数的混合 Transformer 架构,在 Artificial Analysis 图像竞技场中位居 Elo 排名第一。生成速度较前代提升 6 倍,特别适合追求高质量摄影级写实效果的用户。
核心能力:
- 摄影级写实图像,细节还原度极高。
- 生成速度极快(Flux 1.1 Pro Turbo 版本)。
- 多样性强:同一提示词多次生成风格不重复。
- 通过 Replicate API 或 fal.ai 接入。
触发示例:
"生成一张写实风格的城市夜景图"
"帮我出一张专业商务人像,摄影风格"
"生成 4 张不同构图的产品展示图"
安装:
openclaw skills install flux-image
4. 即梦(Seedance)图像技能(seedance-image)
适用场景:国内用户、小红书/公众号配图、中文提示词
即梦是字节跳动推出的 AI 图像生成产品,核心优势在于对中文提示词的优化支持,生成图像风格贴合国内内容平台审美。若主要服务国内用户,该技能最为贴合实际需求。GitHub 社区已有 Seedance2-skill(38 star)和 media-skills(22 star)等实现。
核心能力:
- 中文提示词直接生成,无需翻译。
- 风格贴合国内内容平台审美(小红书、公众号)。
- 支持写实、插画、动漫、设计感等多种风格。
- 通过七牛云 MaaS 平台 API 接入,网络延迟低。
触发示例:
"生成一张小红书封面图,治愈系,浅粉色调"
"帮我画一张公众号配图,主题是效率提升"
"生成一张扁平风格的信息图"
安装:
openclaw skills install seedance-image
4 个图像生成技能横向对比
| 维度 | Gemini 图像 | DALL-E/gpt-image | Flux | 即梦 |
|---|---|---|---|---|
| 提示词遵循度 | 高 | 极高 | 高 | 中(中文优化) |
| 写实质量 | 中高 | 高 | 极高 | 中高 |
| 生成速度 | 快 | 中 | 极快(Turbo) | 快 |
| 中文支持 | 一般 | 一般 | 一般 | 优秀 |
| API 可用性 | 需 Gemini Key | 需 OpenAI Key | 需 Replicate/fal | 七牛云 MaaS |
| 适合人群 | 通用开发者 | 内容营销 | 设计师/高质量需求 | 国内内容创作者 |
| GitHub 热度 | 1,300+ star | 高 | 极高 | 38+ star |
选型建议:
- 全场景尝试:优先安装 Gemini 图像技能,免费额度充足,集成度最高。
- 质量优先:选用 Flux 1.1 Pro,行业 Elo 排名领先。
- 内容营销需求:选择 DALL-E/gpt-image-1,提示词控制最精准。
- 国内内容平台:即梦,中文提示词优化 + 国内网络友好。
图像生成技能与其他技能组合使用
单独使用图像技能固然便捷,但真正释放内容生产力的关键在于与其他技能组合使用。以下展示几个实战场景。
组合一:内容写作 + 配图一体化
公众号写作技能 + Gemini 图像技能
→ "基于这份行业报告撰写公众号文章,并生成 3 张配图"
组合二:数据分析 + 可视化出图
Excel 分析技能 + DALL-E 图像技能
→ "分析销售数据,生成数据趋势配图并发送至飞书"
组合三:小红书内容矩阵
小红书生成技能 + 即梦图像技能
→ "基于该产品,撰写 5 篇小红书笔记并各生成一张封面图"
安装与配置完整步骤
第 1 步:获取技能包
访问 LinSkills 平台,搜索“图像生成”,选择所需技能包,查阅功能说明及 API 依赖要求。
第 2 步:安装技能
# 安装单个技能
openclaw skills install gemini-image
# 批量安装图像技能组合
openclaw skills install gemini-image openai-image seedance-image
# 确认安装成功
openclaw skills list
第 3 步:配置 API Key
在 ~/.openclaw/openclaw.json 文件中添加对应 API Key:
{
"skills": {
"entries": {
"gemini-image": {
"enabled": true,
"env": { "GEMINI_API_KEY": "your_key" }
},
"openai-image": {
"enabled": true,
"env": { "OPENAI_API_KEY": "your_key" }
},
"seedance-image": {
"enabled": true,
"env": { "QINIU_MAAS_TOKEN": "your_token" }
}
}
}
}
第 4 步:自然语言触发
重启 OpenClaw 后,直接描述需求即可触发:
"帮我生成一张产品封面图" → 自动调用已安装的图像技能
"用写实风格出一张城市夜景" → Flux 技能响应
"生成一张适合小红书的封面" → 即梦技能响应
按角色推荐安装方案
| 角色 | 推荐安装 | 理由 |
|---|---|---|
| 个人开发者 | gemini-image | 免费额度充足,通用性广泛 |
| 内容运营 | openai-image + seedance-image | 精准控图 + 国内平台适配 |
| 设计师 | flux-image | 极高质量,行业 Elo 榜首 |
| 小红书创作者 | seedance-image | 中文优化,审美契合国内平台 |
| 全能用户 | 全部安装 | 按场景智能切换 |
FAQ
Q1:安装多个图像技能后,OpenClaw 如何确定调用哪个?
不会混淆,前提是每个技能的描述中明确设置了触发关键词。建议在提示时指定风格(例如“用 Flux 生成……”或“用即梦生成……”),或在同类场景下仅保留一个活跃技能,避免冲突。
Q2:图像技能生成的图片存储位置?
默认保存至当前工作区目录,具体路径由技能包配置决定,可在技能 SKILL.md 文件中查看输出路径设置。
Q3:图像生成技能需要额外购买 API 服务吗?
Gemini 提供免费额度,可先免费试用;OpenAI 和 Flux 需付费账户;即梦通过七牛云 MaaS 平台按量计费,国内访问速度更稳定。
Q4:是否支持批量生成图片?
支持。在提示中指定数量即可(例如“生成 6 张不同风格的封面图”),技能将依次调用 API 批量输出,结果统一保存至指定目录。
Q5:图像技能能否修改已有图片?
支持,但取决于底层 API 能力。Gemini Image 和 gpt-image-1 均支持图像编辑(Inpainting),Flux 则主要专注于文生图。
总结
| 技能 | 一句话 | 安装命令 |
|---|---|---|
gemini-image | 通用首选:免费额度充足,支持多轮对话调整 | openclaw skills install gemini-image |
openai-image | 提示词最精准,内容营销首选 | openclaw skills install openai-image |
flux-image | 最高图像质量,摄影级写实 | openclaw skills install flux-image |
seedance-image | 中文最友好,国内平台首选 | openclaw skills install seedance-image |
图像生成技能获取入口:LinSkills 平台,安装命令 openclaw skills install 。
本文技能信息依据 OpenClaw Skills 生态(2026 年 3 月)及 GitHub 社区数据整理。Flux 参数数据来源于 Replicate 官方文档,Gemini 图像技能热度数据来自 GitHub(nano-banana-pro-prompts-recommend-skill,1,300+ star)。技能包功能以 LinSkills 平台最新版本为准。

