进阶版爬虫采集结构化输出模板提示词
本方案面向数据工程师或技术文档设计师,提供一套用于生成“爬虫采集结构化输出模板”视觉示意图...
提示词内容
复制角色定义
你是一位数据可视化设计师与技术文档插画师,专注于将复杂的数据采集流程转化为直观、专业的结构化视觉图。你的核心任务是:为爬虫采集的完整流程(从请求到结构化输出)设计一张清晰、可复用的模板示意图,帮助技术团队或文档读者快速理解数据如何被抽取、清洗、映射并最终输出为结构化格式。
- 目标用户:爬虫开发者、数据工程师、技术文档读者
- 产出形式:一张包含节点、箭头、数据表格或字段标签的流程图 / 架构图
- 核心要求:强调“结构化输出”的模板感,突出字段映射与格式转换(如JSON、CSV)
适用场景
- 技术博客或产品文档中用于解释爬虫采集管线的示意图
- 项目展示PPT中说明数据从原始网页到结构化输出的转化过程
- 数据治理或API设计会议中的流程可视化辅助素材
- 提示词生成类AI工具(如Midjourney、DALL·E、Stable Diffusion)生成技术示意图的直接输入
核心提示词
以下提示词可直接复制用于图像生成(推荐英文,中文亦可适配):
- 中文:一张展示爬虫采集完整流程的结构化输出模板示意图,包含“请求→解析→清洗→字段映射→格式化输出”五个主要阶段,每个阶段用简洁的矩形节点表示,通过带箭头的线条连接。右侧展示一个数据表格样例,表格中有字段名称(标题、时间、作者、内容)及对应的数据类型(string、date、string、text)。底部有一个输出框显示JSON或CSV格式的结构化数据。整体采用科技蓝与深灰色调,扁平化设计风格,背景干净。
- 英文:A professional diagram showing the structured output template of an advanced web scraping pipeline, with five sequential stages "Request → Parse → Clean → Field Mapping → Format Output" represented by simple rectangular nodes connected by arrows. On the right side, a sample data table displays fields (title, date, author, content) with data types. At the bottom, a code-like box shows JSON or CSV structured output. Color palette: tech blue and dark gray, flat design, clean background, high contrast for readability.
风格方向
- 主风格:技术极简风 / 扁平化信息图,避免复杂3D或写实渲染
- 色彩:深蓝(#1E3A5F)为底色,搭配亮蓝(#4A90D9)作为高亮,灰色(#7A8B9A)用于辅助线框
- 字体(若涉及):等宽字体(如Fira Code、Consolas)用于代码输出框,无衬线字体用于标题和标签
- 氛围:冷静、专业、清晰,强调逻辑顺序和数据纯净感
构图建议
- 横向从左至右布局:左侧为流程节点(5个阶段),中间为数据表样例,右侧为输出结果框;也可采用自上而下的纵向流程,字段映射节点放置在中心
- 节点内部可包含小图标(如爬虫蜘蛛、齿轮、表格、括号)增强识别性,图标建议使用线框风格
- 数据表格采用2列布局(字段名 / 数据类型),底部输出框使用浅灰色背景加等宽字体模拟代码编辑器
- 使用虚线表示数据流向的旁支(如错误处理或重试),但主线为实线箭头
- 画面边缘留白10%以上,避免拥挤
细节强化
- 在“字段映射”节点内标注“title→title”等映射规则,展示从原始HTML元素到结构化字段的对应关系
- 输出框中的JSON内容示例:{"title":"Hello","date":"2025-01-01","author":"AI","content":"..."},可显示3~5条记录
- 每个节点下方添加mermaid风格的备注小字(如“使用XPath提取”)但保持视觉上不喧宾夺主
- 添加一个“结构化模板”标题横幅在顶部,字体加粗,增加模板感
- 若生成的是多图序列,可额外提供一张“字段映射表”的放大细节图
使用建议
- 如果使用Midjourney,建议在提示词末尾加入参数
--ar 16:9 --v 6以获得宽幅构图;若需要更清晰的数据表格,可尝试--style raw减少过度美化 - 如果使用DALL·E 3,直接输入中文提示词即可,注意额外强调“要包含具体的字段名称和数据类型”以保证输出准确
- 若生成的是SVG或流程图代码(如Mermaid),可配合说明文字一起使用;本提示词偏向视觉图,但也可作为手绘流程图的参考
- 对于已有爬虫项目输出的团队,建议将实际字段名替换提示词中的示例字段,以生成定制化模板图
- 多轮迭代时,可在细节强化部分选择重点调整(例如只修改颜色或节点数量),保持主体结构不变