TextIn xParse Dify插件2025年最新使用教程:新手零基础从入门到精通实战指南完整版
TextIn xParse Dify插件简介
在AI应用开发领域,Dify作为开源平台已逐步成为构建LLM应用的首选工具之一。其设计目标明确——加速从原型到部署的链路,让团队聚焦业务逻辑而非基础设施。配合后端即服务与LLMOps理念,这一平台对开发者相当友好。
TextIn xParse则卡位文档处理场景,定位为端到端的AI基础设施。核心痛点清晰:将格式混乱的非结构化文档转化为可检索、可分析的结构化数据。
如今,两个工具在Dify市场上完成了对接。xParse插件已正式上架,可快速嵌入工作流,显著增强平台的文档理解与处理能力。
xParse在Dify中的使用方法
一、xParse Dify插件亮点
多种解析引擎支持:集成TextIn自研高性能引擎(推荐)、MinerU、PaddleOCR等主流方案,可根据文档类型灵活选用。
强大的文档处理能力:覆盖PDF、Word、Excel、PPT、图片等格式,精准提取标题、公式、图表、表格,完整保留文档的语义结构。
赋能工作流:为Dify内Agent赋予真正的文档“读写”能力,在RAG、知识库构建、信息提取等场景下表现从容。
灵活的配置选项:支持自定义引擎、去水印、切边增强等参数,适配多变业务需求。
二、实战演练:两个案例带你快速上手
理论落地,上手才是关键。下面通过两个典型场景演示xParse插件的具体集成步骤。
准备
在Dify插件页面安装xParse插件(私有化部署同样适用)。
接下来需要配置API信息。
在插件配置页面,准备好以下参数:
x-ti-app-id:xParse的应用 ID,必填。
x-ti-secret-code:xParse的密钥,必填。
提示:前往TextIn工作台获取API Key即可。具体获取方式可查阅API Key文档。
案例一:解析单文件,搭建Chat Document应用
想要与文档直接对话?按以下步骤快速实现。
第一步:创建空白应用,选择“Chatflow”
输入应用名称与描述。
第二步:在创建的初始模板中,选择“开始”节点
点击右侧“+”按钮添加变量,字段类型选“单文件”,填写变量名称(此处填input_file)。支持的文档类型选“文档与图片”,上传文件类型选“本地上传”。
第三步:添加工具节点——xParse插件,用于解析上一步上传的文件
第四步:设置xParse的输入变量,选择上一步的input_file
xParse插件支持以下配置:
文件输入:选择要解析的文件(必填)
解析引擎:可选Textin(推荐)、Textin Lite、Mineru、PaddleOCR等(持续接入中)
预处理:可开启切边矫正、去水印等功能
其他参数详情可参考插件说明文档。
第五步:配置LLM模型
选择“LLM”节点后,若尚未配置模型,需先在插件市场安装(此处以gpt-5为例)。
“上下文”处,选择xParse的输出变量text(即解析文档后生成的Markdown格式内容)。
在“SYSTEM”区域,根据实际需求编写提示词。例如可设为“在文档解析text中提取用户的问题答案”。
第六步:预览,上传文件并提问
至此,一个简易的文档问答应用(Chat PDF)搭建完毕。点击“预览”,验证效果。
结果如下:
第七步:发布与测试
保存并发布应用。现在上传一份PDF或图片,即可直接与之进行自由对话。
案例二:自动化批量处理文档,并上传至云端S3
如需批量处理大量文档并归档,xParse插件同样可以胜任。
第一步:安装S3插件
第二步:配置S3 bucket
第三步:创建工作流
字段类型选择“文件列表”,填写变量名称(此处填upload_files),支持的文档类型选“文档与图片”。
第四步:添加“迭代”
在“开始”节点后添加“迭代”,并在迭代内配置xParse节点。迭代的输入设为开始节点的upload_files,输出节点暂不填写,待整个迭代配置完成后,再选择xParse节点解析的files。
将xParse的输入参数file设为迭代器的item。
第五步:增加中间节点“代码执行”,转换解析结果
输入变量(变量名称须与代码定义一致):
text:选择xParse文档解析的输出变量text
fileName:选择“迭代”节点的item的name
输出变量(同样须与代码定义一致):
fileName:String
base64:String
代码选择JavaScript,编写转换逻辑:
function main({text, fileName}) {
const fileContent = Buffer.from(text, 'utf-8').toString('base64');
return {
fileName,
base64: fileContent
};
}Python版本如下:
import base64
def main(text: str, fileName: str):
base64_content = base64.b64encode(text.encode('utf-8')).decode('utf-8')
return {
'fileName': fileName,
'base64': base64_content
}
第六步:配置S3插件,上传内容
添加工具节点S3,选择“通过S3上传base64”。
文件base64选代码执行(图中为转换xParse MD文本)输出的base64字段。
S3对象key填写文件存储的路径。在botos3插件配置界面已填好bucket名称,此处只需填写bucket下的存储目录。选择代码执行(图中为转换xParse MD文本)的fileName。
第七步:预览效果
连接结束节点,此简易的S3上传工作流即配置完成。点击“运行”查看实际输出。
第八步:查看文档
运行结束后,前往云存储服务后台检查S3桶内是否已上传解析后的md文件。
三、更多应用场景
xParse Dify插件的能力远不止于此,以下几个方向值得深入探索:
RAG应用构建
利用xParse解析文档,结合Dify知识库搭建智能问答系统。xParse的智能分块功能确保文档切分合理、语义完整,从而提升检索精准度。
信息提取Agent
搭配xParse的信息抽取能力,构建自动化信息提取Agent。无论是合同、发票还是订单,均可从中提取结构化数据,完成录入与验证,大幅提升自动化水平。
批量文档处理
使用迭代节点批量处理文档,配合xParse多种解析引擎,可根据文档类型自动匹配最优方案,处理效率与准确性均有保障。
四、常见问题
Q: 如何选择合适的解析引擎?
A:
- textin:适配多数场景,速度与准确性均衡,推荐首选。
- textin-lite:适合纯文本、表格图片、电子档PDF等场景,速度更快,价格更低。
- mineru:在学术论文等场景下表现突出。
- paddle:擅长多语言与复杂文档(如PPT),效果显著。
Q: xParse支持哪些文件格式?
A: xParse支持PDF、Word、Excel、PPT、图片(JPG、PNG等)等多种常见格式。
Q: 如何获取API Key?
A: 请前往TextIn工作台获取x-ti-app-id和x-ti-secret-code,详细获取方式可参考API Key文档。
Q: 解析后的结果格式是什么?
A: xParse默认返回Markdown格式文本,同时支持返回JSON格式的结构化数据,包含文档元素、坐标信息等详细内容。
