Kimi自动归类电子发票 文件智能读取实战指南
先说几个核心判断:如果你手上有几十张PDF格式的电子发票,想批量提取开票日期、不含税金额、销售方名称、纳税人识别号等字段,再按供应商名称自动分文件夹归档——手动逐张复制粘贴确实效率太低。Kimi的文件智能读取功能能直接解析PDF中的结构化信息,无需额外安装OCR软件,也不用自己写代码。
整体流程仅三步:上传、提取、生成脚本。
上传发票PDF并触发智能解析
打开Kimi官网或App,点击「+新建对话」,然后选择「上传文件」,一次拖入1到50张电子发票PDF(单张不超过30MB即可)。注意前提:PDF必须是文字可选中状态,如果是扫描件转成的PDF,需要先用WPS或Adobe OCR预处理,否则Kimi的识别准确率会明显下降。
文件上传后,Kimi右下角会自动弹出「已识别为发票类文档」的提示,直接点击「开始分析」,结构化提取随即启动。
让Kimi精准定位关键字段
在对话框里输入指令,直接用动词指令即可,不需要加“请”“麻烦”这类冗余词,Kimi对动词指令的响应更稳定。
方法一:用字段名加冒号强制对齐
输入:“提取每张发票的:开票日期、不含税金额、销售方名称、销售方纳税人识别号、发票代码、发票号码”
方法二:用表格形式指定输出格式
输入:“以表格形式返回结果,列名依次为[发票代码][发票号码][开票日期][销售方名称][销售方税号][金额],空值填‘/’”
另外要注意:如果某张发票缺少销售方税号,Kimi不会强行编造,直接留空或标“/”——这一点比不少财务软件更靠谱。
导出结构化数据并生成归类指令
第一步:点击结果表格右上角的「导出为Excel」,保存到本地。
第二步:打开Excel,确认A1单元格是“发票代码”,F1是“金额”,销售方名称列必须放在D列(如果列序不对,先手动调整)。
第三步:回到Kimi新建一个对话,上传刚导出的Excel,然后输入:“读取D列(销售方名称),为每个不重复的名称生成一句Windows命令,格式为:mkdir ‘张三科技有限公司’ && move *‘张三科技有限公司’*.* ‘张三科技有限公司’,所有命令合并成一段纯文本,不加编号、不换行、不用引号嵌套引号”
这样生成的脚本可以直接粘贴进CMD或PowerShell执行。Kimi会自动处理公司名里的斜杠、星号、冒号等不能用于文件夹名的字符,替换成中文顿号——省去了手动调试的麻烦。