专业版爬虫采集PRD写作提示词

2026-05-18阅读 794热度 794

这是一份为产品经理与数据工程师设计的专业提示词方案,旨在通过定义清晰的创作角色与目标,将“...

爬虫采集 PRD写作 数据抓取 专业版

提示词内容

复制

角色定义与任务定位

请以“资深产品经理兼数据需求架构师”的身份,并协同“数据爬虫工程师”的视角,来使用本提示词方案。您的核心目标是:为计划开发或升级一套“企业级专业版网络爬虫数据采集系统”撰写一份结构严谨、细节清晰、技术可行且兼顾商业价值的产品需求文档,确保开发团队能准确理解数据采集的业务逻辑、技术边界与交付标准。

适用场景

  • 规划面向企业客户、具备高稳定性与合规性的付费数据采集产品。
  • 为内部数据分析平台或商业智能系统,定义规范化的外部数据接入需求。
  • 升级现有爬虫工具,增加如智能反爬绕过、数据清洗、任务调度等高级功能。
  • 在项目启动前,与研发、测试、法务团队对齐数据采集范围、性能指标与风险控制点。

核心提示词

可直接用于生成或构建PRD框架的核心指令组合:

  • 撰写一份专业版网络爬虫系统的产品需求文档,需涵盖【业务背景、目标用户、核心功能列表、非功能性需求】。
  • 详细定义数据采集源:指定目标网站类型(如新闻门户、电商平台、社交媒体),并列出示例URL;明确采集字段(如标题、价格、评论、发布时间)。
  • 设计爬虫任务调度策略:包括采集频率(每日/实时)、触发条件、优先级队列管理与失败重试机制。
  • 规定数据输出与处理要求:输出格式(JSON/CSV/数据库直连)、数据去重规则、脏数据清洗逻辑与实时质量监控指标。
  • 阐述系统管理与合规性:用户权限分级(管理员/操作员)、操作日志审计、遵守Robots协议、请求频率控制与数据安全存储方案。

风格方向

  • 文档风格:采用技术文档与商业文档结合体。语言精确、无歧义,多使用条款式、清单式描述,避免散文式表达。
  • 视觉基调:在描述系统架构或流程时,提示生成“专业的技术框图”、“清晰的泳道流程图”或“状态转换图”,配色以蓝色、灰色系为主,体现严谨与可靠。
  • 表述焦点:强调“Why”(商业价值与用户痛点)与“What”(功能具体定义),对“How”(具体代码实现)仅做边界限定,不深入技术细节。

构图建议(用于辅助图表生成)

  • 系统架构图:建议采用分层构图,展示“用户控制台 - 调度服务器 - 爬虫节点 - 数据存储/清洗模块”的层级关系。
  • 数据流示意图:使用箭头清晰标示从“目标网站”到“原始数据池”,再经“清洗加工”流入“标准数据库”的完整路径。
  • 任务生命周期图:以时间线或状态机形式,描绘爬虫任务从“创建”、“调度中”、“执行中”、“成功/失败”到“重试/终止”的全过程。

细节强化

  • 性能指标量化:明确具体数值要求,如“单任务支持最大并发数:50”,“日均稳定采集数据量:100万条”,“页面解析成功率 ≥ 99.5%”。
  • 异常处理场景:详细列举常见异常,如“IP被封锁”、“网站结构变更”、“网络超时”,并分别给出系统预设应对策略。
  • 扩展性描述:说明系统如何通过“插件化”或“配置化”支持新网站模板的快速接入,降低二次开发成本。
  • 合规与风险:增设独立章节,说明数据版权声明、用户隐私保护措施(如脱敏处理)及与法律法规的符合性声明。

使用建议

  • 在使用核心提示词生成初稿后,务必用“扮演用户评审”的角度,对每个功能点进行“如果……会怎样”的提问,以补充边界情况。
  • 将“非功能性需求”部分(性能、安全、可用性、可维护性)作为重点检查项,这是专业版与普通版的核心区别所在。
  • 在向开发团队陈述时,可配合使用“构图建议”生成的图表,使技术方案更直观易懂。
  • 建议将最终PRD与“用户故事”或“用例”结合,形成从业务场景到技术实现的完整闭环。

常见问题

相关提示词

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策