TextIn xParse Dify插件2025年最新使用教程：新手零基础从入门到精通实战指南完整版

2026-06-12阅读 0热度 0

使用教程

TextIn xParse Dify插件简介

在AI应用开发领域，Dify作为开源平台已逐步成为构建LLM应用的首选工具之一。其设计目标明确——加速从原型到部署的链路，让团队聚焦业务逻辑而非基础设施。配合后端即服务与LLMOps理念，这一平台对开发者相当友好。

TextIn xParse则卡位文档处理场景，定位为端到端的AI基础设施。核心痛点清晰：将格式混乱的非结构化文档转化为可检索、可分析的结构化数据。

如今，两个工具在Dify市场上完成了对接。xParse插件已正式上架，可快速嵌入工作流，显著增强平台的文档理解与处理能力。

xParse在Dify中的使用方法

一、xParse Dify插件亮点

多种解析引擎支持：集成TextIn自研高性能引擎（推荐）、MinerU、PaddleOCR等主流方案，可根据文档类型灵活选用。
强大的文档处理能力：覆盖PDF、Word、Excel、PPT、图片等格式，精准提取标题、公式、图表、表格，完整保留文档的语义结构。
赋能工作流：为Dify内Agent赋予真正的文档“读写”能力，在RAG、知识库构建、信息提取等场景下表现从容。
灵活的配置选项：支持自定义引擎、去水印、切边增强等参数，适配多变业务需求。

二、实战演练：两个案例带你快速上手

理论落地，上手才是关键。下面通过两个典型场景演示xParse插件的具体集成步骤。

准备

在Dify插件页面安装xParse插件（私有化部署同样适用）。
接下来需要配置API信息。

在插件配置页面，准备好以下参数：

x-ti-app-id：xParse的应用 ID，必填。
x-ti-secret-code：xParse的密钥，必填。

提示：前往TextIn工作台获取API Key即可。具体获取方式可查阅API Key文档。

案例一：解析单文件，搭建Chat Document应用

想要与文档直接对话？按以下步骤快速实现。

第一步：创建空白应用，选择“Chatflow”

输入应用名称与描述。

第二步：在创建的初始模板中，选择“开始”节点

点击右侧“+”按钮添加变量，字段类型选“单文件”，填写变量名称（此处填input_file）。支持的文档类型选“文档与图片”，上传文件类型选“本地上传”。

第三步：添加工具节点——xParse插件，用于解析上一步上传的文件

第四步：设置xParse的输入变量，选择上一步的input_file

xParse插件支持以下配置：


文件输入：选择要解析的文件（必填）


解析引擎：可选Textin（推荐）、Textin Lite、Mineru、PaddleOCR等（持续接入中）


预处理：可开启切边矫正、去水印等功能

其他参数详情可参考插件说明文档。

第五步：配置LLM模型

选择“LLM”节点后，若尚未配置模型，需先在插件市场安装（此处以gpt-5为例）。

“上下文”处，选择xParse的输出变量text（即解析文档后生成的Markdown格式内容）。

在“SYSTEM”区域，根据实际需求编写提示词。例如可设为“在文档解析text中提取用户的问题答案”。

第六步：预览，上传文件并提问

至此，一个简易的文档问答应用（Chat PDF）搭建完毕。点击“预览”，验证效果。

结果如下：

第七步：发布与测试

保存并发布应用。现在上传一份PDF或图片，即可直接与之进行自由对话。

案例二：自动化批量处理文档，并上传至云端S3

如需批量处理大量文档并归档，xParse插件同样可以胜任。

第一步：安装S3插件

第二步：配置S3 bucket

第三步：创建工作流

字段类型选择“文件列表”，填写变量名称（此处填upload_files），支持的文档类型选“文档与图片”。

第四步：添加“迭代”

在“开始”节点后添加“迭代”，并在迭代内配置xParse节点。迭代的输入设为开始节点的upload_files，输出节点暂不填写，待整个迭代配置完成后，再选择xParse节点解析的files。

将xParse的输入参数file设为迭代器的item。

第五步：增加中间节点“代码执行”，转换解析结果

输入变量（变量名称须与代码定义一致）：


text：选择xParse文档解析的输出变量text


fileName：选择“迭代”节点的item的name

输出变量（同样须与代码定义一致）：


fileName：String


base64：String

代码选择JavaScript，编写转换逻辑：

function main({text, fileName}) {
    const fileContent = Buffer.from(text, 'utf-8').toString('base64');
    return {
        fileName,
        base64: fileContent
    };
}

Python版本如下：

import base64

def main(text: str, fileName: str):
    base64_content = base64.b64encode(text.encode('utf-8')).decode('utf-8')
    return {
        'fileName': fileName,
        'base64': base64_content
    }

第六步：配置S3插件，上传内容

添加工具节点S3，选择“通过S3上传base64”。

文件base64选代码执行（图中为转换xParse MD文本）输出的base64字段。

S3对象key填写文件存储的路径。在botos3插件配置界面已填好bucket名称，此处只需填写bucket下的存储目录。选择代码执行（图中为转换xParse MD文本）的fileName。

第七步：预览效果

连接结束节点，此简易的S3上传工作流即配置完成。点击“运行”查看实际输出。

第八步：查看文档

运行结束后，前往云存储服务后台检查S3桶内是否已上传解析后的md文件。

三、更多应用场景

xParse Dify插件的能力远不止于此，以下几个方向值得深入探索：

RAG应用构建

利用xParse解析文档，结合Dify知识库搭建智能问答系统。xParse的智能分块功能确保文档切分合理、语义完整，从而提升检索精准度。

信息提取Agent

搭配xParse的信息抽取能力，构建自动化信息提取Agent。无论是合同、发票还是订单，均可从中提取结构化数据，完成录入与验证，大幅提升自动化水平。

批量文档处理

使用迭代节点批量处理文档，配合xParse多种解析引擎，可根据文档类型自动匹配最优方案，处理效率与准确性均有保障。

四、常见问题

Q: 如何选择合适的解析引擎？

textin：适配多数场景，速度与准确性均衡，推荐首选。
textin-lite：适合纯文本、表格图片、电子档PDF等场景，速度更快，价格更低。
mineru：在学术论文等场景下表现突出。
paddle：擅长多语言与复杂文档（如PPT），效果显著。

Q: xParse支持哪些文件格式？

A: xParse支持PDF、Word、Excel、PPT、图片（JPG、PNG等）等多种常见格式。

Q: 如何获取API Key？

A: 请前往TextIn工作台获取x-ti-app-id和x-ti-secret-code，详细获取方式可参考API Key文档。

Q: 解析后的结果格式是什么？

A: xParse默认返回Markdown格式文本，同时支持返回JSON格式的结构化数据，包含文档元素、坐标信息等详细内容。