通义千问测试用例清单：提示词新手写法排行榜及最新完整教程

2026-06-22阅读 0热度 0

千问

新手在编写通义千问测试用例提示词时，常犯的错误有三个：用自然语言描述预期行为但未定义输入格式；遗漏角色设定；混淆测试目标与测试步骤。先厘清一个核心认知——写提示词不是写作文，关键让模型**精准理解执行任务**、**接收什么材料**、**输出何种结构**。以下方法从基础到进阶，每条均可直接复制后修改使用。

基础版：单轮问答类测试提示词

此版本最适配验证模型对固定指令的响应准确率，例如“解答一道数学题”或“重写一个句子”。编写分三步：

第一步，以“你是一个…”锁定角色身份。举例：“你是一个严谨的语文教师，仅纠正语法错误，不解释原因。”

第二步，用“请执行以下任务：”引出具体操作。注意：避免“试试”“看看”等模糊动词，替换为“输出”“列出”“判断是否正确”。

第三步，提供【不可省略的输入样例】。例如“输入：‘他昨天去公园了’→ 输出：‘正确’”，以此让模型明确边界条件。

带约束条件的测试提示词

需要控制输出长度、格式或禁止特定内容时，限制条件必须写成硬性指令，不得置于括号内，也不能用“尽量”“希望”等模糊表达。

一个高效技巧：用分号分隔多条条件。例如“你是一个医疗助手；只回答是/否；不提供依据；不使用标点符号”。

更推荐直接使用“必须”“禁止”“仅允许”等强限定词。例如：“必须用中文回答；禁止出现英文缩写；仅允许输出3个字以内”。

关键细节：条件超过3条时，建议换行书写以提高可读性，并方便自查遗漏。但绝对不要使用项目符号——通义千问会将“•”解析为文本内容，导致条件失效。

多轮对话模拟测试提示词

这类提示词用于检验模型对上下文的记忆能力以及指令连续遵循性。新手最容易出错的两个点：未标注轮次，或混用用户/模型的身份标识。

方法一：显式标注说话人：
用户：北京的天气怎么样？
模型：[此处留空，由测试者填入实际输出]
用户：温度单位换成华氏度。
模型：[填入第二轮输出]

方法二：采用编号加冒号结构。例如：“① 用户问：‘苹果多少钱一斤？’；② 模型答：‘5元’；③ 用户追问：‘那梨呢？’；④ 模型需根据②推断价格逻辑并作答。”

操作很简单，直接将四句话按顺序粘贴至对话框。但【必须确保③中‘那梨呢？’不重复‘苹果’二字】，否则模型可能忽略上下文切换，直接沿用上一轮逻辑。

边界值与异常输入测试提示词

新手最容易忽略极端场景，例如空输入、超长文本、乱码、混合编码。此类测试旨在逼迫模型暴露其处理逻辑。

输入：“”（两个英文双引号之间无任何字符）→ 观察是否返回空响应或报错提示。

输入：连续2000个“a”+“请总结这段文字”→ 检查是否截断、是否触发token限制反馈。

输入：“áéíóú 你好 123 ?”→ 验证多语言、emoji与数字混合时的处理能力。

通义千问测试用例清单：提示词新手写法排行榜及最新完整教程

基础版：单轮问答类测试提示词

带约束条件的测试提示词

多轮对话模拟测试提示词

边界值与异常输入测试提示词

相关阅读

最新教程

最新资讯