RAGFlow v0.25.6 发布:自主浏览、RAPTOR升级与Agent增强
RAGFLOW v0.25.6 来了,这次更新最让人兴奋的,莫过于 AI 终于可以自己“上网冲浪”了。Browser 组件的加入和 RAPTOR 检索能力的质变,让这套工具集的实用价值又上了一个台阶。这篇东西,咱们就好好聊聊这次版本更新里,最值得关注的那些事儿。
一、版本概览
这次发布的 v0.25.6 版本(2026年5月26日),从覆盖面上看,根本不像是一个小版本迭代,它几乎把 Agent、RAG、API、Go 驱动、文档解析、异步调度、权限安全、国际化 这些核心模块全给“清洗”了一遍。
说它是单点补丁?那可太小看它了。这是一次明显偏向 能力补齐、体验增强、问题修复、生态扩展 的综合升级。
具体来说,最值得关注的有这么几个方向:
- Agent 新增 Browser 组件,让 AI 能像个真人一样浏览和操作网页
- RAG RAPTOR 构建升级到 AHC 模式,把语义扩展的格局从文档级别拉到了数据集级别
- Agent 新增轻量级
@tool装饰器,注册 Python 函数变得前所未有的简单 - Agent 消息支持显示 base64 图片,告别纯文本的单调
- Doc Generator 文件元数据可作为独立变量暴露,工作流灵活度更高
- Agent chat completion 支持传入
chat_template_kwargs,对话控制更精细 /chat/completions接口支持只发送最新消息,API 调用更轻量- 检索阶段向量相似度权重被修复,排序和召回终于回归正轨
- 大量异步、解析器、表格、HTML、日志、文档状态、空响应等问题被修复
- Go 侧能力大规模补齐,模型生态持续扩张
- 安全性增强,SSRF、user_id 伪造、敏感字段泄露统统被堵上
- 国际化完善,法语翻译补齐了约 1400 个缺失键
- 最低 Python 版本提升到 3.13
废话不多说,咱们就按这次更新的内容,一个一个来拆解。
二、新功能:Agent 新增 Browser 组件
要说这次更新最“炸”的新功能,那绝对是 Agent 里新增的 Browser 组件。
这个组件的核心能力是什么?就是 让 AI 能够自主地浏览网页,并且与它交互。
它意味着 Agent 不再是那个“你喂它什么,它吃什么”的被动工具,而是具备了更强的主动操作能力。以后,涉及到需要访问网页、点击按钮、填写表单、获取在线信息的场景,Agent 终于可以自己上手了。这对于构建真正“智能”的自动化助手来说,是一次关键的补强。
从这次发布的说明来看,这是 v0.25.6 最具代表性的新增特性,没有之一。
三、RAG 改进:RAPTOR 构建引入 AHC 模式
RAG 方面,这次对 RAPTOR 构建 做了个“大手术”,引入了 AHC 模式(Ψ-RAG)。这个升级不是一个简单的修修补补,而是重构了索引构建的底层逻辑。
1. 语义扩展维度升级
AHC 模式最大的不同在于,它把语义扩展从 文档级别 提升到了 数据集级别。这意味着索引时,它会从整个数据集的角度去理解语义,而不是局限于单个文档内部。这样做的结果,就是构建出来的语义结构更具全局性和代表性。
2. 构建性能提升
根据官方说明,新模式的索引构建性能要显著高于旧版 RAPTOR。而且,不仅仅是快,在 Recall@5 和 平均 F1 这两个关键指标上,也都优于旧版本。一句话概括:又快又准。
3. 支持模式切换
系统并不是一刀切,用户可以在 AHC 和 GMM 模式之间自由切换。这为不同场景下的策略选择留出了空间,非常灵活。
4. 本版本修复问题
这个特性并非在 v0.25.6 才首次引入,它早在 v0.25.3 就有了雏形。本次更新主要是在此基础上,修复了多个相关 Bug,让整个模块变得更稳定、更可靠。
四、Agent 改进:轻量级 @tool 装饰器
作为开发者,你们一定会爱上这个更新。这次版本新增了一个 轻量级 @tool 装饰器。
它的目标非常明确:简化 Python 函数注册流程。以前,要把一个 Python 函数挂载给聊天模型使用,可能需要写不少样板代码。现在,一个简单的装饰器就能搞定,开发效率瞬间提升。这是 Agent 工程化体验上一个非常务实且有效的优化。
五、Agent 改进:消息支持显示 base64 图片
Agent 的交互方式终于不局限于“纯文本”了。现在,Agent 消息 支持显示 base64 编码的图片。
这在需要图文混排、截图展示、视觉信息传递的场景下,价值巨大。比如,Agent 可以分析一张截图并直接展示出来,而不是干巴巴地描述“这张图里有什么”。
六、Agent 改进:Doc Generator 文件元数据作为独立变量暴露
这次版本还对 Doc Generator 组件进行了改进。现在,文档生成器在处理文件时,其 文件元数据 可以作为一个 独立的变量 暴露出来。这意味着,你在编排工作流时,可以更精细、更自由地访问和使用这些元信息,比如文件名、来源、创建时间等,极大地提升了工作流的灵活性。
七、Agent 改进:支持传入 chat_template_kwargs
Agent 的 chat completion 接口现在开放了 chat_template_kwargs 参数。这相当于给了开发者一把“钥匙”,可以在构建对话请求时,对模型内部的模板参数进行更细粒度的控制。这对于需要微调对话行为、注入特定上下文的高级玩法来说,是个不小的增强。
八、接口修复:/chat/completions 允许只发送最新消息
这是个非常实用的修复。/chat/completions 接口现在允许在请求体中只发送最新的消息,不再强制要求携带完整的对话历史。
这意味着什么?
- API 调用变得更加轻量
- 请求体更简洁
- 更符合“只传当前轮输入”的调用习惯
- 在实际集成中,这种方式也更常见、更高效
能看出来,官方团队在 API 设计的人性化上,是下了功夫的。
九、检索修复:向量相似度权重在检索阶段未生效
必须要提的是,这次版本修复了一个直接影响检索质量的问题:向量相似度权重在检索阶段没有被正确应用。
这种问题属于“暗病”,不直接报错,但会潜移默化地影响检索结果的排序和召回质量。修复之后,配置的权重参数终于能生效了,检索行为才算是真正回到了我们预期的主线上。
十、数据集与配置页面修复
日常运维中,一些“小毛病”最烦人。这次版本也集中清理了一波:
- 解析器配置保存失败:数据集配置页面中,parser configs 无法保存的问题已被修复。
- 数据源详情页日志显示不完整:日志信息终于能完整展示,排查问题更方便。
- 文档状态过滤失败:document status filtering failure 的问题也得到了解决。
这些都是直接影响日常操作体验的痛点。
十一、空响应与解析修复
底层健壮性方面也做了不少功课:
- 修复了 空 LLM choices response 时的崩溃防护问题
- 修复了 HTML 标签在 ingestion pipeline parser output 中残留 的问题
- 修复了 table parser metadata 的问题
- 修复了 空文件 的报错提示,让错误信息更清晰
这些改进共同提升了数据摄入和解析链路的稳定性。
十二、RAG RAPTOR 相关修复
除了 AHC 模式升级,RAPTOR 还修复了一个关键兼容问题:使用 Infinity document engine 时,RAPTOR 构建过程会停止。现在,这个“拦路虎”已经被移除,RAPTOR 在不同文档引擎下的兼容性更好了。
十三、流式响应解析修复
修复了 Mistral / Upstage reasoning models 的流式响应解析问题。这主要影响模型在流式输出时的稳定性,修复后,使用这些推理模型时,体验会更流畅。
十四、异步与事件循环问题修复
针对 asyncio 相关问题做了一次集中修复,包括:
- 修复 asyncio event loop nesting
- 修复 fire-and-forget task 问题
- 修复 asyncio.Semaphore bound to different event loop 错误
这些在平时开发中可能不太常见,但在高并发、异步任务调度的场景下,每一个都是潜在的定时冲击波。修复后,系统的整体稳定性会有显著提升。
十五、Agent 相关 bug 修复
Agent 也有多项针对性修复:
- 修复 Agent component prompt variable 消失 的问题
- 修复 search vector_similarity_weight 相关问题
- 修复 agent attachment download api 的移动问题
- 修复 agent 创建与更新 API 中 canvas_type 的支持问题
这些都属于 Agent 功能细节上的关键修正,确保了核心功能的稳定性。
十六、API 与安全性增强
安全是底线。这次版本在安全方面下了大力气:
- session user_id 伪造修复:堵住了通过 request body 伪造用户身份的漏洞。
/dify/retrieval权限校验:修复了知识库所有权校验的问题,防止越权访问。- 敏感字段泄露防护:用户 API 响应中不再泄露敏感字段。
- SSRF 防护:修复了
misc_utils.download_img在处理 OAuth 头像时的 SSRF 风险。
可以说,本次版本对安全性进行了明显的加固。
十七、文档与工具能力修复
文档相关能力也有不少更新:
/documents/{id}/download相关问题的修复与回退- 解析器输出中的 HTML 标签 被清理
- PDF 文档顶部红色高亮替换为黄色,更清晰易读
- chunk 标签列表显示 问题修复
- 提供了 chunk management、chat assistant、retrieval 的 SDK 和 cURL 示例,开箱即用感更强
- metadata 相关问题修复
十八、Go 侧能力大规模补齐
这次更新,Go 驱动的模型生态堪称大爆发,覆盖了 provider、embed、rerank、ASR、TTS、OCR 等多个维度。
1. 新增或补充的 provider / driver
- TogetherAI
- n1n.ai
- GPUStack(chat)
- Azure OpenAI 模型驱动
- PPIO provider
- Groq provider
- Tencent Hunyuan provider
- TokenPony provider
- HuaweiCloud model provider
- ModelScope provider
- OrcaRouter provider
- FuturMix provider
- TokenHub provider
- AWS Bedrock provider
2. 新增 embed 能力
TogetherAI embed、Xinference embed、Tencent Hunyuan embed
3. 新增 rerank 能力
Xinference rerank、Novita rerank、DeepInfra rerank、TogetherAI rerank
4. 新增 ASR / TTS 能力
Xinference ASR/TTS、TogetherAI ASR/TTS、ZhipuAI ASR、OpenRouter ASR、Groq reasoning_chat/TTS/ASR
5. 新增 OCR 能力
ZhipuAI OCR、Baidu OCR 输入校验、PaddleOCR_Local provider、通过 drivers 路由的 hosted OCR providers
6. 其他 Go 侧能力
OpenAI audio endpoints 支持、Ollama 的 chat/listmodels/embed 重写、Elasticsearch functions in Go
可见,Go 生态在 v0.25.6 中得到了全面的扩充,几乎覆盖了主流的模型服务和多模态任务。
十九、Evaluation 与测试增强
研发质量方面也有跟进:
- evaluation 中增加 token usage 跟踪
- 增加新的 restful api suite 测试与测试用例
- 改进 retry 和 timeout
- 改进 CI
这些工作是保证项目长期健康发展的重要基石。
二十、国际化与文档更新
版本维护和社区支持上也在持续推进:
- 将 Python 最低版本要求提升至 3.13
- 更新 README 和文档中的版本引用到 v0.25.6
- 更新 v0.25.5 发布说明
- 完成 Discord 集成指南
- 初稿与草稿形式的 v0.25.6 发布说明同步完善
- 法语翻译补齐约 1400 个缺失键
二十一、其他修复与完善
除了上述大项,还有大量细节修复,覆盖了前后端、API、任务调度、解析链路和安全边界多个层面:
- 修复 API 路径错误
- 修复 任务语言缺失
- 修复 模型类型加入 llm_setting
- 修复 OpenAI chat completion 与 session_id / conversation_id 关联问题
- 修复 文档下载内容类型推断相关问题后回退
- 修复 数据源详情日志显示不完整
- 修复 表格解析 metadata
- 修复 PDF 高亮颜色
- 修复 空文件报错信息
- 修复 tag list 显示
- 修复 parser config 保存问题
- 修复 restful api suite 测试
- 修复 agent attachment download API
- 修复 search vector_similarity_weight
- 修复 prompt variable 消失
- 修复 canvas_type 支持
- 修复 敏感字段泄露
- 修复 SSRF
- 修复 empty LLM choices
- 修复 event loop 相关问题
二十二、版本总结
代码地址:github.com/infiniflow/ragflow
总的来说,ragflow v0.25.6 是一次几乎无死角的版本更新。它集齐了功能增强、性能优化、问题修复和生态扩张四大要素,对于任何正在使用或评估 RAGFLOW 的团队来说,都绝对值得立即升级。
