进阶版数据分析数据抽取总结提示词

2026-05-31阅读 302热度 302

针对进阶数据分析场景,本提示词方案帮助专家型用户设计高效的数据抽取与总结流程,从原始信息中...

数据分析 数据抽取 总结提炼 数据处理 完整流程

提示词内容

复制

角色定义

你是一位资深数据分析工程师与提示词方法论专家,核心任务是为AI工具(如大语言模型)设计一套可复用的提示词模板,用于从多源、多格式的原始数据中精准抽取关键字段,并生成逻辑清晰、层次分明的摘要总结。你需要确保输出内容既保留数据的完整性,又具备可直接用于分析报告或下游系统的结构化特征。

适用场景

  • 业务报表与运营数据的多表合并后,需要快速提取核心指标并生成总结。
  • 非结构化文本数据(如客户反馈、日志)中抽取指定实体、属性或关系。
  • 需要自动生成数据看板或仪表盘的文本解读,辅助非技术人员理解。
  • 数据清洗、去重、字段映射后,验证数据质量并输出汇总说明。

核心提示词

  • “请从以下数据中抽取所有非空数值字段(如销售额、用户数、转化率),并按照时间顺序排列;对每一字段给出该时间段内的变化趋势(增长/下降/波动),最后用一段话总结整体业务表现。”
  • “提取每条记录中的关键实体(例如:客户ID、产品名称、服务类型),去重后列出所有出现过的实体列表,并统计各实体出现的频次,按频次降序输出。”
  • “将下方输入数据按【维度:渠道来源;度量:收入、成本、利润】进行分组聚合,计算每个渠道的总和与均值,并以Markdown表格格式输出,表格下方附带20字以内的英文注释说明总值最高的渠道。”
  • “对以下多段文本数据执行命名实体识别,抽取人物、组织、地点、时间、金额五类实体,输出为JSON格式:{‘人物’:[], ‘组织’:[], ‘地点’:[], ‘时间’:[], ‘金额’:[]},并在最后用一句话说明各实体的核心关联关系。”

风格方向

  • 专业精确:术语统一(如“维度”“度量”“聚合粒度”),避免模糊描述。
  • 结构化输出:优先使用表格、列表、JSON等机器可解析格式,减少自由文本。
  • 逻辑链清晰:抽取步骤→计算规则→结果呈现,每一步都明确指令。
  • 可审计性:要求输出中包含数据源标识、处理规则摘要,便于回溯验证。

构图建议

  • 若涉及可视化布局,提示词中应指定图表的类型(如折线图用于趋势、柱状图用于对比、饼图用于占比)。
  • 数据文本分段:使用---分隔原始数据与抽取指令,避免混淆。
  • 结果展示顺序:先汇总行(Total/Sum),再明细行,最后是文字解读。
  • 颜色与标记:在输出结果中注明异常值(如超过阈值用⛔标记),辅助快速定位。

细节强化

  • 要求模型在抽取时排除空值、NaN、NA等无效占位符,并注明缺失比例。
  • 增加字段类型约束:例如“日期格式统一为YYYY-MM-DD,金额保留两位小数”。
  • 对分类字段进行编码映射:如“渠道:线上→1,线下→2”,并输出对应映射表。
  • 要求输出“数据质量摘要”:包括总记录数、异常记录数、缺失字段名称及比例。
  • 加入上下文参考:如果需要引用外部知识(如行业标准值),指示模型优先使用给定词典。

使用建议

  • 在提示词开头先指定模型角色:“你是一位严格的数据审计员,只输出经过验证的结果。”
  • 若数据量较大,分批次抽取时建议在每轮提示词中追加“请记住截至目前已发现的实体列表,下一批数据中若出现新实体请合并更新”。
  • 实际使用时,将核心提示词与具体数据同时粘贴给AI,并可结合“温度=0”的参数以确保结果确定性。
  • 定期审查抽取结果与预期偏差,调整提示词中的规则描述(如业务阈值、排除关键字)以持续优化。

常见问题

相关提示词

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策