RAGFlow v0.25.6 发布：自主浏览、RAPTOR升级与Agent增强

2026-05-28阅读 0热度 0

ai 人工智能

好的，没问题。作为一位在RAG领域深耕多年的技术博主，我来帮你把这篇更新日志“盘活”，让它读起来更像是一份来自一线的深度解析，而非一份机械的公告。 ---

RAGFLOW v0.25.6 来了，这次更新最让人兴奋的，莫过于 AI 终于可以自己“上网冲浪”了。Browser 组件的加入和 RAPTOR 检索能力的质变，让这套工具集的实用价值又上了一个台阶。这篇东西，咱们就好好聊聊这次版本更新里，最值得关注的那些事儿。

一、版本概览

这次发布的 v0.25.6 版本（2026年5月26日），从覆盖面上看，根本不像是一个小版本迭代，它几乎把 Agent、RAG、API、Go 驱动、文档解析、异步调度、权限安全、国际化 这些核心模块全给“清洗”了一遍。

说它是单点补丁？那可太小看它了。这是一次明显偏向 能力补齐、体验增强、问题修复、生态扩展 的综合升级。

具体来说，最值得关注的有这么几个方向：

Agent 新增 Browser 组件，让 AI 能像个真人一样浏览和操作网页
RAG RAPTOR 构建升级到 AHC 模式，把语义扩展的格局从文档级别拉到了数据集级别
Agent 新增轻量级 @tool 装饰器，注册 Python 函数变得前所未有的简单
Agent 消息支持显示 base64 图片，告别纯文本的单调
Doc Generator 文件元数据可作为独立变量暴露，工作流灵活度更高
Agent chat completion 支持传入 chat_template_kwargs，对话控制更精细
/chat/completions 接口支持只发送最新消息，API 调用更轻量
检索阶段向量相似度权重被修复，排序和召回终于回归正轨
大量异步、解析器、表格、HTML、日志、文档状态、空响应等问题被修复
Go 侧能力大规模补齐，模型生态持续扩张
安全性增强，SSRF、user_id 伪造、敏感字段泄露统统被堵上
国际化完善，法语翻译补齐了约 1400 个缺失键
最低 Python 版本提升到 3.13

废话不多说，咱们就按这次更新的内容，一个一个来拆解。

二、新功能：Agent 新增 Browser 组件

要说这次更新最“炸”的新功能，那绝对是 Agent 里新增的 Browser 组件。

这个组件的核心能力是什么？就是 让 AI 能够自主地浏览网页，并且与它交互。

它意味着 Agent 不再是那个“你喂它什么，它吃什么”的被动工具，而是具备了更强的主动操作能力。以后，涉及到需要访问网页、点击按钮、填写表单、获取在线信息的场景，Agent 终于可以自己上手了。这对于构建真正“智能”的自动化助手来说，是一次关键的补强。

从这次发布的说明来看，这是 v0.25.6 最具代表性的新增特性，没有之一。

三、RAG 改进：RAPTOR 构建引入 AHC 模式

RAG 方面，这次对 RAPTOR 构建 做了个“大手术”，引入了 AHC 模式（Ψ-RAG）。这个升级不是一个简单的修修补补，而是重构了索引构建的底层逻辑。

1. 语义扩展维度升级

AHC 模式最大的不同在于，它把语义扩展从 文档级别 提升到了 数据集级别。这意味着索引时，它会从整个数据集的角度去理解语义，而不是局限于单个文档内部。这样做的结果，就是构建出来的语义结构更具全局性和代表性。

2. 构建性能提升

根据官方说明，新模式的索引构建性能要显著高于旧版 RAPTOR。而且，不仅仅是快，在 Recall@5 和 平均 F1 这两个关键指标上，也都优于旧版本。一句话概括：又快又准。

3. 支持模式切换

系统并不是一刀切，用户可以在 AHC 和 GMM 模式之间自由切换。这为不同场景下的策略选择留出了空间，非常灵活。

4. 本版本修复问题

这个特性并非在 v0.25.6 才首次引入，它早在 v0.25.3 就有了雏形。本次更新主要是在此基础上，修复了多个相关 Bug，让整个模块变得更稳定、更可靠。

四、Agent 改进：轻量级 `@tool` 装饰器

作为开发者，你们一定会爱上这个更新。这次版本新增了一个 轻量级 @tool 装饰器。

它的目标非常明确：简化 Python 函数注册流程。以前，要把一个 Python 函数挂载给聊天模型使用，可能需要写不少样板代码。现在，一个简单的装饰器就能搞定，开发效率瞬间提升。这是 Agent 工程化体验上一个非常务实且有效的优化。

五、Agent 改进：消息支持显示 base64 图片

Agent 的交互方式终于不局限于“纯文本”了。现在，Agent 消息 支持显示 base64 编码的图片。

这在需要图文混排、截图展示、视觉信息传递的场景下，价值巨大。比如，Agent 可以分析一张截图并直接展示出来，而不是干巴巴地描述“这张图里有什么”。

六、Agent 改进：Doc Generator 文件元数据作为独立变量暴露

这次版本还对 Doc Generator 组件进行了改进。现在，文档生成器在处理文件时，其 文件元数据 可以作为一个 独立的变量 暴露出来。这意味着，你在编排工作流时，可以更精细、更自由地访问和使用这些元信息，比如文件名、来源、创建时间等，极大地提升了工作流的灵活性。

七、Agent 改进：支持传入 `chat_template_kwargs`

Agent 的 chat completion 接口现在开放了 chat_template_kwargs 参数。这相当于给了开发者一把“钥匙”，可以在构建对话请求时，对模型内部的模板参数进行更细粒度的控制。这对于需要微调对话行为、注入特定上下文的高级玩法来说，是个不小的增强。

八、接口修复：`/chat/completions` 允许只发送最新消息

这是个非常实用的修复。/chat/completions 接口现在允许在请求体中只发送最新的消息，不再强制要求携带完整的对话历史。

这意味着什么？

API 调用变得更加轻量
请求体更简洁
更符合“只传当前轮输入”的调用习惯
在实际集成中，这种方式也更常见、更高效

能看出来，官方团队在 API 设计的人性化上，是下了功夫的。

九、检索修复：向量相似度权重在检索阶段未生效

必须要提的是，这次版本修复了一个直接影响检索质量的问题：向量相似度权重在检索阶段没有被正确应用。

这种问题属于“暗病”，不直接报错，但会潜移默化地影响检索结果的排序和召回质量。修复之后，配置的权重参数终于能生效了，检索行为才算是真正回到了我们预期的主线上。

十、数据集与配置页面修复

日常运维中，一些“小毛病”最烦人。这次版本也集中清理了一波：

解析器配置保存失败：数据集配置页面中，parser configs 无法保存的问题已被修复。
数据源详情页日志显示不完整：日志信息终于能完整展示，排查问题更方便。
文档状态过滤失败：document status filtering failure 的问题也得到了解决。

这些都是直接影响日常操作体验的痛点。

十一、空响应与解析修复

底层健壮性方面也做了不少功课：

修复了 空 LLM choices response 时的崩溃防护问题
修复了 HTML 标签在 ingestion pipeline parser output 中残留 的问题
修复了 table parser metadata 的问题
修复了 空文件 的报错提示，让错误信息更清晰

这些改进共同提升了数据摄入和解析链路的稳定性。

十二、RAG RAPTOR 相关修复

除了 AHC 模式升级，RAPTOR 还修复了一个关键兼容问题：使用 Infinity document engine 时，RAPTOR 构建过程会停止。现在，这个“拦路虎”已经被移除，RAPTOR 在不同文档引擎下的兼容性更好了。

十三、流式响应解析修复

修复了 Mistral / Upstage reasoning models 的流式响应解析问题。这主要影响模型在流式输出时的稳定性，修复后，使用这些推理模型时，体验会更流畅。

十四、异步与事件循环问题修复

针对 asyncio 相关问题做了一次集中修复，包括：

修复 asyncio event loop nesting
修复 fire-and-forget task 问题
修复 asyncio.Semaphore bound to different event loop 错误

这些在平时开发中可能不太常见，但在高并发、异步任务调度的场景下，每一个都是潜在的定时冲击波。修复后，系统的整体稳定性会有显著提升。

十五、Agent 相关 bug 修复

Agent 也有多项针对性修复：

修复 Agent component prompt variable 消失 的问题
修复 search vector_similarity_weight 相关问题
修复 agent attachment download api 的移动问题
修复 agent 创建与更新 API 中 canvas_type 的支持问题

这些都属于 Agent 功能细节上的关键修正，确保了核心功能的稳定性。

十六、API 与安全性增强

安全是底线。这次版本在安全方面下了大力气：

session user_id 伪造修复：堵住了通过 request body 伪造用户身份的漏洞。
/dify/retrieval 权限校验：修复了知识库所有权校验的问题，防止越权访问。
敏感字段泄露防护：用户 API 响应中不再泄露敏感字段。
SSRF 防护：修复了 misc_utils.download_img 在处理 OAuth 头像时的 SSRF 风险。

可以说，本次版本对安全性进行了明显的加固。

十七、文档与工具能力修复

文档相关能力也有不少更新：

/documents/{id}/download 相关问题的修复与回退
解析器输出中的 HTML 标签 被清理
PDF 文档顶部红色高亮替换为黄色，更清晰易读
chunk 标签列表显示 问题修复
提供了 chunk management、chat assistant、retrieval 的 SDK 和 cURL 示例，开箱即用感更强
metadata 相关问题修复

十八、Go 侧能力大规模补齐

这次更新，Go 驱动的模型生态堪称大爆发，覆盖了 provider、embed、rerank、ASR、TTS、OCR 等多个维度。

1. 新增或补充的 provider / driver

TogetherAI
n1n.ai
GPUStack（chat）
Azure OpenAI 模型驱动
PPIO provider
Groq provider
Tencent Hunyuan provider
TokenPony provider
HuaweiCloud model provider
ModelScope provider
OrcaRouter provider
FuturMix provider
TokenHub provider
AWS Bedrock provider

2. 新增 embed 能力
TogetherAI embed、Xinference embed、Tencent Hunyuan embed

3. 新增 rerank 能力
Xinference rerank、Novita rerank、DeepInfra rerank、TogetherAI rerank

4. 新增 ASR / TTS 能力
Xinference ASR/TTS、TogetherAI ASR/TTS、ZhipuAI ASR、OpenRouter ASR、Groq reasoning_chat/TTS/ASR

5. 新增 OCR 能力
ZhipuAI OCR、Baidu OCR 输入校验、PaddleOCR_Local provider、通过 drivers 路由的 hosted OCR providers

6. 其他 Go 侧能力
OpenAI audio endpoints 支持、Ollama 的 chat/listmodels/embed 重写、Elasticsearch functions in Go

可见，Go 生态在 v0.25.6 中得到了全面的扩充，几乎覆盖了主流的模型服务和多模态任务。

十九、Evaluation 与测试增强

研发质量方面也有跟进：

evaluation 中增加 token usage 跟踪
增加新的 restful api suite 测试与测试用例
改进 retry 和 timeout
改进 CI

这些工作是保证项目长期健康发展的重要基石。

二十、国际化与文档更新

版本维护和社区支持上也在持续推进：

将 Python 最低版本要求提升至 3.13
更新 README 和文档中的版本引用到 v0.25.6
更新 v0.25.5 发布说明
完成 Discord 集成指南
初稿与草稿形式的 v0.25.6 发布说明同步完善
法语翻译补齐约 1400 个缺失键

二十一、其他修复与完善

除了上述大项，还有大量细节修复，覆盖了前后端、API、任务调度、解析链路和安全边界多个层面：

修复 API 路径错误
修复 任务语言缺失
修复 模型类型加入 llm_setting
修复 OpenAI chat completion 与 session_id / conversation_id 关联问题
修复 文档下载内容类型推断相关问题后回退
修复 数据源详情日志显示不完整
修复 表格解析 metadata
修复 PDF 高亮颜色
修复 空文件报错信息
修复 tag list 显示
修复 parser config 保存问题
修复 restful api suite 测试
修复 agent attachment download API
修复 search vector_similarity_weight
修复 prompt variable 消失
修复 canvas_type 支持
修复 敏感字段泄露
修复 SSRF
修复 empty LLM choices
修复 event loop 相关问题

二十二、版本总结

代码地址：github.com/infiniflow/ragflow

总的来说，ragflow v0.25.6 是一次几乎无死角的版本更新。它集齐了功能增强、性能优化、问题修复和生态扩张四大要素，对于任何正在使用或评估 RAGFLOW 的团队来说，都绝对值得立即升级。

RAGFlow v0.25.6 发布：自主浏览、RAPTOR升级与Agent增强

一、版本概览

二、新功能：Agent 新增 Browser 组件

三、RAG 改进：RAPTOR 构建引入 AHC 模式

四、Agent 改进：轻量级 `@tool` 装饰器

五、Agent 改进：消息支持显示 base64 图片

六、Agent 改进：Doc Generator 文件元数据作为独立变量暴露

七、Agent 改进：支持传入 `chat_template_kwargs`

八、接口修复：`/chat/completions` 允许只发送最新消息

九、检索修复：向量相似度权重在检索阶段未生效

十、数据集与配置页面修复

十一、空响应与解析修复

十二、RAG RAPTOR 相关修复

十三、流式响应解析修复

十四、异步与事件循环问题修复

十五、Agent 相关 bug 修复

十六、API 与安全性增强

十七、文档与工具能力修复

十八、Go 侧能力大规模补齐

十九、Evaluation 与测试增强

二十、国际化与文档更新

二十一、其他修复与完善

二十二、版本总结

相关阅读

最新教程

最新资讯

一、版本概览

二、新功能：Agent 新增 Browser 组件

三、RAG 改进：RAPTOR 构建引入 AHC 模式

四、Agent 改进：轻量级 @tool 装饰器

五、Agent 改进：消息支持显示 base64 图片

六、Agent 改进：Doc Generator 文件元数据作为独立变量暴露

七、Agent 改进：支持传入 chat_template_kwargs

八、接口修复：/chat/completions 允许只发送最新消息

九、检索修复：向量相似度权重在检索阶段未生效

十、数据集与配置页面修复

十一、空响应与解析修复

十二、RAG RAPTOR 相关修复

十三、流式响应解析修复

十四、异步与事件循环问题修复

十五、Agent 相关 bug 修复

十六、API 与安全性增强

十七、文档与工具能力修复

十八、Go 侧能力大规模补齐

十九、Evaluation 与测试增强

二十、国际化与文档更新

二十一、其他修复与完善

二十二、版本总结

相关阅读

最新教程

最新资讯

四、Agent 改进：轻量级 `@tool` 装饰器

七、Agent 改进：支持传入 `chat_template_kwargs`

八、接口修复：`/chat/completions` 允许只发送最新消息