进阶版爬虫采集LoRA训练计划提示词
本提示词方案旨在为AI绘画LoRA模型训练者提供一套结构化的爬虫数据采集计划,通过定义清晰的执行...
提示词内容
复制角色定义与任务定位
请以“AI模型训练数据架构师”的身份,运用本方案。你的核心目标是:为训练一个特定风格的LoRA模型,系统化地规划与执行网络图像数据的爬虫采集任务,确保最终获得高质量、结构清晰、标注准确的图像数据集。
适用场景
- 需要为特定画风(如水墨、赛博朋克)、角色或概念训练定制化LoRA模型时,进行前期素材收集。
- 已有明确主题方向,但缺乏系统方法从公开平台批量获取合规训练图像。
- 希望将零散的图片搜索与下载,升级为可重复、可管理的结构化数据抓取流程。
核心提示词
以下提示词组合可直接用于构思你的采集指令或作为图像描述基础:
- 基础采集目标:high-quality images of [具体对象/风格,如:cyberpunk cityscape], digital art, trending on ArtStation, 8K resolution
- 风格强化:in the style of [参考艺术家,如:Greg Rutkowski], [风格关键词,如:detailed matte painting, dramatic lighting]
- 视图与构图:multiple angles, full body shot, close-up details, wide landscape view
- 负面过滤:-watermark -logo -text -blurry -lowres -photograph (用于排除非目标素材)
风格方向
- 数据一致性:确保采集的图片在艺术风格、质量水准、主题聚焦上保持高度一致,这是训练优质LoRA的关键。
- 视觉风格化:明确目标视觉风格(如二次元平涂、厚涂油画感、简约矢量图),并以此作为爬虫筛选的核心标准之一。
- 氛围统一:控制采集图片的整体氛围,例如统一为“静谧光影”或“激烈动感”,以强化模型学习的特征维度。
构图建议
- 有计划地采集不同景别(全景、中景、特写)和视角(平视、俯视、仰视)的图片,以丰富训练数据的多样性。
- 针对角色类训练,应涵盖全身、半身、面部特写以及多种姿势和表情的构图。
- 对于场景类训练,需兼顾空镜、带环境互动的主体以及不同时间(晨昏昼夜)和天气的构图变化。
细节强化
- 材质与纹理:在描述中强调如“丝绸质感”、“金属锈蚀”、“潮湿反光”等具体材质细节,引导采集更富表现力的图片。
- 色彩控制:指定主导色系或色彩氛围,如“低保和度莫兰迪色系”、“霓虹荧光对比色”,使数据集色彩倾向明确。
- 关键特征:突出需要LoRA学习的核心特征,例如“独特的发型设计”、“机械结构的接缝细节”、“特定笔触痕迹”。
使用建议
- 将上述“核心提示词”模块中的关键词进行灵活组合,作为你在搜索引擎、专业图站或爬虫脚本中的搜索查询词。
- 在正式大规模采集前,先用小批量关键词进行测试性采集,评估图片质量与相关性,优化你的提示词组合。
- 采集后,务必进行人工筛选,剔除质量不佳或不相关的图片,并为图片设计规范的文件命名和标签(TAG)系统,这是“结构化”的最终体现。
- 本计划是动态文档,在实际采集过程中可根据遇到的图片类型不断反哺和调整关键词列表。