TextIn xParse Dify插件2025年最新使用教程:新手零基础从入门到精通实战指南完整版

2026-06-12阅读 0热度 0
使用教程

TextIn xParse Dify插件简介

在AI应用开发领域,Dify作为开源平台已逐步成为构建LLM应用的首选工具之一。其设计目标明确——加速从原型到部署的链路,让团队聚焦业务逻辑而非基础设施。配合后端即服务与LLMOps理念,这一平台对开发者相当友好。

TextIn xParse Dify插件使用教程

TextIn xParse则卡位文档处理场景,定位为端到端的AI基础设施。核心痛点清晰:将格式混乱的非结构化文档转化为可检索、可分析的结构化数据。

如今,两个工具在Dify市场上完成了对接。xParse插件已正式上架,可快速嵌入工作流,显著增强平台的文档理解与处理能力。

xParse在Dify中的使用方法

一、xParse Dify插件亮点

多种解析引擎支持:集成TextIn自研高性能引擎(推荐)、MinerU、PaddleOCR等主流方案,可根据文档类型灵活选用。
强大的文档处理能力:覆盖PDF、Word、Excel、PPT、图片等格式,精准提取标题、公式、图表、表格,完整保留文档的语义结构。
赋能工作流:为Dify内Agent赋予真正的文档“读写”能力,在RAG、知识库构建、信息提取等场景下表现从容。
灵活的配置选项:支持自定义引擎、去水印、切边增强等参数,适配多变业务需求。

二、实战演练:两个案例带你快速上手

理论落地,上手才是关键。下面通过两个典型场景演示xParse插件的具体集成步骤。

准备

在Dify插件页面安装xParse插件(私有化部署同样适用)。
接下来需要配置API信息。

在插件配置页面,准备好以下参数:

x-ti-app-id:xParse的应用 ID,必填。
x-ti-secret-code:xParse的密钥,必填。

提示:前往TextIn工作台获取API Key即可。具体获取方式可查阅API Key文档。

案例一:解析单文件,搭建Chat Document应用

想要与文档直接对话?按以下步骤快速实现。

第一步:创建空白应用,选择“Chatflow”

输入应用名称与描述。

第二步:在创建的初始模板中,选择“开始”节点

点击右侧“+”按钮添加变量,字段类型选“单文件”,填写变量名称(此处填input_file)。支持的文档类型选“文档与图片”,上传文件类型选“本地上传”。

第三步:添加工具节点——xParse插件,用于解析上一步上传的文件

第四步:设置xParse的输入变量,选择上一步的input_file

xParse插件支持以下配置:


文件输入:选择要解析的文件(必填)


解析引擎:可选Textin(推荐)、Textin Lite、Mineru、PaddleOCR等(持续接入中)


预处理:可开启切边矫正、去水印等功能


其他参数详情可参考插件说明文档。

第五步:配置LLM模型

选择“LLM”节点后,若尚未配置模型,需先在插件市场安装(此处以gpt-5为例)。

“上下文”处,选择xParse的输出变量text(即解析文档后生成的Markdown格式内容)。

在“SYSTEM”区域,根据实际需求编写提示词。例如可设为“在文档解析text中提取用户的问题答案”。

第六步:预览,上传文件并提问

至此,一个简易的文档问答应用(Chat PDF)搭建完毕。点击“预览”,验证效果。

结果如下:

第七步:发布与测试

保存并发布应用。现在上传一份PDF或图片,即可直接与之进行自由对话。

案例二:自动化批量处理文档,并上传至云端S3

如需批量处理大量文档并归档,xParse插件同样可以胜任。

第一步:安装S3插件

第二步:配置S3 bucket

第三步:创建工作流

字段类型选择“文件列表”,填写变量名称(此处填upload_files),支持的文档类型选“文档与图片”。

第四步:添加“迭代”

在“开始”节点后添加“迭代”,并在迭代内配置xParse节点。迭代的输入设为开始节点的upload_files,输出节点暂不填写,待整个迭代配置完成后,再选择xParse节点解析的files。

将xParse的输入参数file设为迭代器的item。

第五步:增加中间节点“代码执行”,转换解析结果

输入变量(变量名称须与代码定义一致):


text:选择xParse文档解析的输出变量text


fileName:选择“迭代”节点的item的name


输出变量(同样须与代码定义一致):


fileName:String


base64:String



代码选择JavaScript,编写转换逻辑:

function main({text, fileName}) {
    const fileContent = Buffer.from(text, 'utf-8').toString('base64');
    return {
        fileName,
        base64: fileContent
    };
}

Python版本如下:

import base64

def main(text: str, fileName: str):
    base64_content = base64.b64encode(text.encode('utf-8')).decode('utf-8')
    return {
        'fileName': fileName,
        'base64': base64_content
    }

第六步:配置S3插件,上传内容

添加工具节点S3,选择“通过S3上传base64”。

文件base64选代码执行(图中为转换xParse MD文本)输出的base64字段。

S3对象key填写文件存储的路径。在botos3插件配置界面已填好bucket名称,此处只需填写bucket下的存储目录。选择代码执行(图中为转换xParse MD文本)的fileName。

第七步:预览效果

连接结束节点,此简易的S3上传工作流即配置完成。点击“运行”查看实际输出。

第八步:查看文档

运行结束后,前往云存储服务后台检查S3桶内是否已上传解析后的md文件。

三、更多应用场景

xParse Dify插件的能力远不止于此,以下几个方向值得深入探索:

RAG应用构建

利用xParse解析文档,结合Dify知识库搭建智能问答系统。xParse的智能分块功能确保文档切分合理、语义完整,从而提升检索精准度。

信息提取Agent

搭配xParse的信息抽取能力,构建自动化信息提取Agent。无论是合同、发票还是订单,均可从中提取结构化数据,完成录入与验证,大幅提升自动化水平。

批量文档处理

使用迭代节点批量处理文档,配合xParse多种解析引擎,可根据文档类型自动匹配最优方案,处理效率与准确性均有保障。

四、常见问题

Q: 如何选择合适的解析引擎?

A:

  • textin:适配多数场景,速度与准确性均衡,推荐首选。
  • textin-lite:适合纯文本、表格图片、电子档PDF等场景,速度更快,价格更低。
  • mineru:在学术论文等场景下表现突出。
  • paddle:擅长多语言与复杂文档(如PPT),效果显著。

Q: xParse支持哪些文件格式?

A: xParse支持PDF、Word、Excel、PPT、图片(JPG、PNG等)等多种常见格式。

Q: 如何获取API Key?

A: 请前往TextIn工作台获取x-ti-app-id和x-ti-secret-code,详细获取方式可参考API Key文档。

Q: 解析后的结果格式是什么?

A: xParse默认返回Markdown格式文本,同时支持返回JSON格式的结构化数据,包含文档元素、坐标信息等详细内容。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策