天工AI PDF长文档快速阅读与问答指南
先讲一个核心结论:天工AI可以处理50MB以内的PDF,但若缺少OCR预处理、文档模式启用和结构锚定这三步联动,它大概率只会返回“文档内容为空”或仅显示页码编号。你真正想要的是从上百页行业报告或学术专著中,精准提取作者的核心论点、论证链条,以及可直接引用的结论——而不是手动逐页翻查,或者让AI给出一句泛泛的“总结”。
那么,如何让天工AI真正替你干活?关键就在于以下三步联动。
确认PDF是否包含可读文本层
打开PDF,尝试用鼠标选中任意段落文字。如果文字无法高亮、无法复制,说明该PDF为扫描版——本质上是图像。天工AI无法从中提取任何语义信息。
此时必须执行OCR。操作很简单:用WPS打开PDF,点击“PDF工具→OCR识别”,语言选中文,点击“开始识别”,完成后再另存为新PDF。使用Adobe Acrobat的用户,可走“工具→扫描和OCR→识别文本”流程。
跳过OCR直接上传,即便天工AI也只能返回“文档内容为空”或一串页码编号。
网页端上传并启用文档模式
接下来,访问tiangong.cn,登录后找到左侧【AI文档】→【新建项目】,然后选择【文档模式】。点击“+ 添加文件”,从本地选取你刚刚OCR处理好的PDF——注意,不要使用拖拽上传。拖拽上传会绕过文档解析引擎。
等待右上角出现“文档已解析完成”提示,同时左侧自动展开一个带层级的目录树——包含章、节、小节——说明标题结构、列表和段落已被成功识别。如果30秒后仍无反应,请检查PDF的“属性→安全性”是否勾选了“禁止复制”。此类加密文件需联系出版方获取授权版本,天工AI无法绕过。
分章节锚定+结构化指令提取观点
方法一:按自然章节截取,适用于学术专著。在左侧目录树中找到目标章节,例如“第四章 群体决策的认知偏差”,单击后天工AI自动定位到该页码范围,右侧预览区高亮显示该章节全部文本。随后在对话框中输入:“请仅基于本章节内容,逐条列出作者提出的3个核心观点,每条不超过18字,不加解释,不引用原文以外信息。”若AI混入其他章节内容,立即追加指令:“忽略所有非本章节页码的文本,重新输出。”
方法二:关键词驱动定位,适用于结构松散的实践类书籍。第一步,在对话框中输入:“请扫描全文,找出所有含‘本质上’‘关键在于’‘根本原因是’‘必须满足’的句子,按出现顺序列出。”第二步,将返回结果复制到本地文本编辑器,手动剔除设问句、举例句、过渡句,仅保留承载独立判断的陈述句(通常为“主语+谓语+宾语”的完整结构)。
构建精准问答的关键提问策略
提问时,最好明确标注段落线索。例如:“在PDF第17页第2段提到的‘动态阈值算法’,其初始化参数设置依据是什么?”
若需答案附带原文支撑,可这样表述:“请用引号标出答案所依据的原文句子,并注明所在页码。”
想触发逻辑推演类回答,调整问法:“根据第4.2节实验数据,若样本量减少30%,文中提出的误差校正机制是否仍满足±2%精度要求?请分步骤说明判断依据。”
这些操作本质上就是直接将问题粘贴进对话框。但务必牢记:每次提问都必须基于“已启用文档模式且解析完成”的状态,否则天工AI会将其当作普通聊天处理,上下文锚点一旦丢失,结果就得从头再来。
