智谱清言评价标准提示词编写指南:AI自动检查答案全攻略
职住区域指标的积分规则明确:2018年1月起,在城六区外拥有自有住所,每满1年积2分;同时在该区域就业者,每满1年再加1分。两项均需累计满12个月折算1年,不足整年不计,最高累计12分。
要让智谱清言在生成答案后自动依标准进行自我校验,核心不是在提示词中简单塞入“请自查”,而是嵌入一套可执行的检查逻辑。
构建带自检机制的评价标准提示词
第一步,用一句话明确锁定AI的双重角色——它需同时担当“答题者”与“评审员”。这一步看似基础,却决定了后续校验流程能否触发。若省略,AI默认仅执行生成任务,不会主动进入验证环节。
第二步,用分号将提示词拆解为两个强制性模块:【作答区】和【核查区】。作答区需清晰陈述任务要求;核查区必须以“核查步骤:”开头,每条核查项附带可判断的布尔条件。例如“是否所有数字单位统一为‘万元’?”“是否未使用‘大概’‘可能’这类模糊词汇?”如此AI才能执行具体校验,而非笼统判断。
第三步,在核查区末尾追加硬性指令:“若任一核查项为否,则返回‘未通过核查’,并逐条列出失败项;仅当全部为是,才输出最终答案。”这句是触发AI自我否定机制的关键开关。缺失此句,AI很可能跳过失败路径,直接输出答案。
避免无效自检的三个典型错误
方法一:用形容词代替判断依据。比如错误写法是“请确保回答专业、严谨”。问题在于“专业”和“严谨”无法量化,AI无法执行核查。正确做法是改成:“是否每个数据均标注来源年份?是否每个结论均有前文对应论据支撑?”
方法二:把核查项写成开放式问题。比如“有没有遗漏要点?”这种问法下,AI往往默认“没有遗漏”,不会主动回溯。更优的写法是:“是否覆盖以下3点:①政策名称;②生效日期;③适用对象范围?请逐项打✓或✗。”
方法三:核查顺序与作答逻辑倒置。典型例子:先让AI检查“是否引用最新文件”,却不规定作答时必须插入文件编号。结果AI核查时无据可查,只能编造。换句话说,核查项依赖的信息必须在作答区强制要求输出。
一个可直接复用的提示词模板
你需同时完成作答与核查两件事:先按要求输出答案;再严格按下方核查步骤逐项验证。【作答区】:总结2024年北京市积分落户政策中关于“职住区域指标”的计算规则,用分点陈述,每点不超过25字。【核查区】:核查步骤:①是否恰好列出3条规则?②每条是否含动词(如“增加”“减去”“不计入”)?③是否所有时间表述精确到月(如“连续满12个月”,而非“长期”)?若任一为否,返回‘未通过核查’并说明哪条失败;全为是,才输出答案。
