通义千问提示词：5步写出自然数据处理流程

2026-06-04阅读 0热度 0

千问

给通义千写数据处理流程提示词，关键在于让它像一位资深数据同事那样自行推演步骤、识别边界、预留容错机制，而不是罗列“数据清洗”“聚合指标”这类黑箱术语。举个运营常见场景：每天上午9点，运营需要从前一日埋点日志中提取已注册但未下单的新用户名单，交给电销组跟进。如果直接写“分析用户行为数据”，模型大概率输出一堆空泛框架；但换成“删除event_type字段为空的整行”“按user_id取timestamp最新的记录”“若某天日志缺失超过2小时，跳过该日不报错”，效果截然不同。指令越具体，输出越可控。

核心经验：没有异常声明的流程在真实数据中必然失败。因此，必须主动声明边界和例外。例如手机号字段包含“-”或空格时，自动清理后再校验长度。这类细节才是模型输出真正可落地的关键。

先界定任务本质，再组织语言

第一步不是写代码，而是明确：谁在什么场景下，用数据做什么。一句话概括。例如“运营每天早上9点从昨日埋点日志中筛选已完成注册但未下单的新用户，导出名单给电销组”。这句话包含了角色（运营）、频率（每天9点）、数据源（昨日埋点日志）、筛选逻辑（注册但未下单）、交付物（名单）。模型立刻理解上下文，无需额外解释。

第二步，将模糊的“处理动作”替换为带主语和条件的动词短语。避免“清洗数据”这种黑箱表述，改为“删除event_type字段为空的整行”或“对每个user_id，保留timestamp最新的记录”。

第三步，主动声明边界和例外。

用对话体替代说明书体

想象平时交代任务的场景：谁会念说明书？所以提示词的诀窍是：以“你正在帮一位新接手业务的同事写SOP”为前提，使用第二人称。例如：“现在你要教小王如何从MySQL导出一周内活跃用户的设备分布，他只会基础SQL，不懂GROUP BY和COUNT的区别。请分三步写清楚：① 连接时使用哪个账号（密码存放在1Password）；② 写查询时如何排除测试账号（uid以‘t_’开头）；③ 导出后用Excel打开，调整列宽避免显示‘#####’。”

另外，务必插入真实环境中的干扰项。例如在提示词末尾追加：“注意：过程中可能遇到字段名突然变更（如‘city_name’下周改为‘location_city’），请在代码注释中标明哪些位置需要人工核对字段映射。”这能让模型默认进入“防翻车”模式，输出更稳健。

嵌入轻量级校验要求

最后，在提示词结尾附加一行业务约束，简洁有效：“最后检查三件事：1. 每个步骤能否独立执行（不依赖上一步的临时表名）；2. 所有路径使用相对路径（如./data/raw/）；3. 时间范围写成‘{{start_date}}’和‘{{end_date}}’占位符，不要硬编码‘20240501’。”

操作非常简单，直接将这三个检查项粘贴到提示词末尾即可。但缺少这一步，模型经常产出带有绝对路径、硬编码日期、强依赖临时变量的不可复用流程。少了这个检验环节，整个流程的复用性将大打折扣。

通义千问提示词：5步写出自然数据处理流程

先界定任务本质，再组织语言

用对话体替代说明书体

嵌入轻量级校验要求

相关阅读

最新教程

最新资讯