数据口径文档提示词:Gemini让AI先给判断标准
先看一个可用的提示词模板:
“请先列出用于判断本数据口径文档是否准确、可执行、可验证的三项核心标准。每项标准必须满足:①可被人工核查(例如‘所有字段必须在数仓DDL中存在对应列名’);②能排除主观描述(例如禁止出现‘一般情况下’‘通常指’等模糊表述);③与后续文档内容形成双向约束(即任一标准不满足,该文档即判定为无效)。不要生成口径内容,只输出这三项标准。”
第一步:强制AI先输出判断标准
操作很简单,直接把上面那段提示词粘贴到输入框,不加任何额外说明,发送即可。
注意,这里有个关键信号要盯住:如果Gemini回复“好的”“已理解”或者直接开始写字段定义,说明它跳过了判断标准环节——这是失效信号,必须中断并重发原提示词。
第二步:确认标准后才进入字段定义
等Gemini完整输出三项标准后,你只需回复一句话:“标准已确认,现在请基于这三项标准,为以下字段生成数据口径文档。”
紧接着粘贴你的字段列表(例如:用户ID、订单创建时间、支付成功状态、GMV金额)。有一点需要特别注意:字段列表必须以纯文本形式提供,不要用表格、代码块或带格式的排版。Gemini对制表符和空格敏感,格式错位会导致字段识别失败。
第三步:校验输出是否受标准约束
这个环节最考验细心。你需要检查Gemini生成的口径文档中,每个字段的描述是否显式呼应第一步的三项标准。
举个例子:如果标准之一是“所有时间字段必须注明时区和精度”,那么“订单创建时间”的定义里就必须出现“UTC+8,精确到秒”字样,不能只写“用户下单那一刻的时间”。
同理,如果某个字段定义中间出现了“大致”“左右”“一般”等词,或者没有引用具体的表名、字段名、计算SQL片段,说明该条目没有通过第二项标准——此时应立即要求重写,不可接受模糊替代。
