海螺AI快速总结长文档：精准提炼提示词技巧

2026-06-10阅读 0热度 0

提示词技巧

先聊实际操作中的痛点。

假设你只有十分钟，要从一本一百二十七页的行业白皮书里，捞出能直接塞进汇报PPT的核心结论。海螺AI响应很快，但返回的摘要往往让人失望——要么浮于表面，要么关键数据支撑点大面积缺失。问题根源在于：提示词没有锁定“精准提炼”这一目标，对信息层级、证据强度和字段边界缺少硬性约束。

用结构化字段锁死信息类型

第一步，在对话框最顶部输入角色定义加字段模板。注意格式：不换行、不加标点、不用英文括号。示例：“你是一名工信部赛迪研究院高级分析师，专注产业政策文本解构。【政策目标】+【适用对象】+【核心条款】+【执行时限】+【配套措施】+【豁免情形】+【溯及效力】”。

第二步，紧接着插入刚性约束条件。每项必须独立成段；【核心条款】里必须包含原文中带有“应当”“不得”“须”字样的完整句子；【执行时限】如果原文没明确年月日，直接标注“未载明”，禁止推测；全文总字数严格控制在680到720字之间。

第三步，上传文档前确认文件是.docx或.txt格式。千万注意：PDF必须先转为可编辑的Word，否则类似“不得”这种强制表述被OCR识别成乱码，条款就会漏检。

方法一：先只传入白皮书前言与第一章，指令就写：“仅提取本部分中所有带编号的政策条款（比如‘第三条’‘（二）’这类），按原文序号排列，每条后面加括号标注所在页码。”

方法二：等第一条返回后，复制它的末尾一句，粘贴到新对话框开头，再追加一句：“接此句，继续提取第二章全部带编号条款。要求：第一，跳过解释性段落；第二，如果条款里含‘试点’或‘暂行’字样，必须在那个条款末尾加★标记；第三，页码标注方式与前章完全一致。”

方法三：处理到附录数据表时，单独发起一次对话。把表格文字截图后的OCR结果粘贴进去，指令改写成：“将下列数值型条目转为陈述句，格式统一为‘XX指标达[数值][单位]，较2025年提升X.X%’。如果缺失同比数据，直接写‘未提供同比值’。”

第一步，在完整提示词的末尾加一条禁令清单：禁用“总体来看”“值得关注的是”“进一步表明”这类过渡套话；禁用“可能”“有望”“预计”这种模糊情态词；禁用任何没在原文出现过的机构简称——比如“工信部”不能替代“工业和信息化部”。

第二步，收到输出后，用Ctrl+F搜索“□”符号。这是海螺AI在识别不清条款边界时自动插入的占位符，发现了就立刻删掉，并且手动补全该处原文条款——不然后续所有页码标注都会系统性偏移。

第三步，遇到含“原则上”“一般应”这类柔性条款的句子，长按该句，在弹出菜单里选择“降权为背景信息”，这样系统就不会再把它纳入核心条款统计。

第一步，逐项检查七组方括号是否全部出现，并且顺序跟最初的指令完全一致。

第二步，如果【豁免情形】是空的，立刻补发一条指令：“请回溯全文，提取所有含‘除外’‘但书’‘以下情形不适用’字样的句子，合并成一段，标题仍用【豁免情形】。”

第三步，如果【溯及效力】没有出现，发送查找指令：“查找全文中‘自X年X月X日起施行’‘本办法施行前已……’‘此前规定与本办法不一致的，以本办法为准’这三类表述，整合成【溯及效力】段。如果没有，就写‘未规定’。”

第四步，打开本地记事本，把全部输出内容粘贴进去，用Word的字数统计功能确认是否落在680到720字区间。如果超了，就复制最后一段开头的30个字，新建一个对话，粘贴后追加一条指令：“压缩至原长度60%，删减修饰语，保留所有数值与法言法语。”