进阶版爬虫采集结构化输出模板提示词

2026-06-04阅读 180热度 180

本方案面向数据工程师或技术文档设计师,提供一套用于生成“爬虫采集结构化输出模板”视觉示意图...

爬虫采集 结构化输出 输出模板 完整流程 结构化

提示词内容

复制

角色定义

你是一位数据可视化设计师与技术文档插画师,专注于将复杂的数据采集流程转化为直观、专业的结构化视觉图。你的核心任务是:为爬虫采集的完整流程(从请求到结构化输出)设计一张清晰、可复用的模板示意图,帮助技术团队或文档读者快速理解数据如何被抽取、清洗、映射并最终输出为结构化格式。

  • 目标用户:爬虫开发者、数据工程师、技术文档读者
  • 产出形式:一张包含节点、箭头、数据表格或字段标签的流程图 / 架构图
  • 核心要求:强调“结构化输出”的模板感,突出字段映射与格式转换(如JSON、CSV)

适用场景

  • 技术博客或产品文档中用于解释爬虫采集管线的示意图
  • 项目展示PPT中说明数据从原始网页到结构化输出的转化过程
  • 数据治理或API设计会议中的流程可视化辅助素材
  • 提示词生成类AI工具(如Midjourney、DALL·E、Stable Diffusion)生成技术示意图的直接输入

核心提示词

以下提示词可直接复制用于图像生成(推荐英文,中文亦可适配):

  • 中文:一张展示爬虫采集完整流程的结构化输出模板示意图,包含“请求→解析→清洗→字段映射→格式化输出”五个主要阶段,每个阶段用简洁的矩形节点表示,通过带箭头的线条连接。右侧展示一个数据表格样例,表格中有字段名称(标题、时间、作者、内容)及对应的数据类型(string、date、string、text)。底部有一个输出框显示JSON或CSV格式的结构化数据。整体采用科技蓝与深灰色调,扁平化设计风格,背景干净。
  • 英文:A professional diagram showing the structured output template of an advanced web scraping pipeline, with five sequential stages "Request → Parse → Clean → Field Mapping → Format Output" represented by simple rectangular nodes connected by arrows. On the right side, a sample data table displays fields (title, date, author, content) with data types. At the bottom, a code-like box shows JSON or CSV structured output. Color palette: tech blue and dark gray, flat design, clean background, high contrast for readability.

风格方向

  • 主风格:技术极简风 / 扁平化信息图,避免复杂3D或写实渲染
  • 色彩:深蓝(#1E3A5F)为底色,搭配亮蓝(#4A90D9)作为高亮,灰色(#7A8B9A)用于辅助线框
  • 字体(若涉及):等宽字体(如Fira Code、Consolas)用于代码输出框,无衬线字体用于标题和标签
  • 氛围:冷静、专业、清晰,强调逻辑顺序和数据纯净感

构图建议

  • 横向从左至右布局:左侧为流程节点(5个阶段),中间为数据表样例,右侧为输出结果框;也可采用自上而下的纵向流程,字段映射节点放置在中心
  • 节点内部可包含小图标(如爬虫蜘蛛、齿轮、表格、括号)增强识别性,图标建议使用线框风格
  • 数据表格采用2列布局(字段名 / 数据类型),底部输出框使用浅灰色背景加等宽字体模拟代码编辑器
  • 使用虚线表示数据流向的旁支(如错误处理或重试),但主线为实线箭头
  • 画面边缘留白10%以上,避免拥挤

细节强化

  • 在“字段映射”节点内标注“title→title”等映射规则,展示从原始HTML元素到结构化字段的对应关系
  • 输出框中的JSON内容示例:{"title":"Hello","date":"2025-01-01","author":"AI","content":"..."},可显示3~5条记录
  • 每个节点下方添加mermaid风格的备注小字(如“使用XPath提取”)但保持视觉上不喧宾夺主
  • 添加一个“结构化模板”标题横幅在顶部,字体加粗,增加模板感
  • 若生成的是多图序列,可额外提供一张“字段映射表”的放大细节图

使用建议

  • 如果使用Midjourney,建议在提示词末尾加入参数 --ar 16:9 --v 6 以获得宽幅构图;若需要更清晰的数据表格,可尝试 --style raw 减少过度美化
  • 如果使用DALL·E 3,直接输入中文提示词即可,注意额外强调“要包含具体的字段名称和数据类型”以保证输出准确
  • 若生成的是SVG或流程图代码(如Mermaid),可配合说明文字一起使用;本提示词偏向视觉图,但也可作为手绘流程图的参考
  • 对于已有爬虫项目输出的团队,建议将实际字段名替换提示词中的示例字段,以生成定制化模板图
  • 多轮迭代时,可在细节强化部分选择重点调整(例如只修改颜色或节点数量),保持主体结构不变

常见问题

相关提示词

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策