RAGFlow v0.25.6 发布:自主浏览、RAPTOR升级与Agent增强

2026-05-28阅读 0热度 0
ai 人工智能
好的,没问题。作为一位在RAG领域深耕多年的技术博主,我来帮你把这篇更新日志“盘活”,让它读起来更像是一份来自一线的深度解析,而非一份机械的公告。 ---

RAGFLOW v0.25.6 来了,这次更新最让人兴奋的,莫过于 AI 终于可以自己“上网冲浪”了。Browser 组件的加入和 RAPTOR 检索能力的质变,让这套工具集的实用价值又上了一个台阶。这篇东西,咱们就好好聊聊这次版本更新里,最值得关注的那些事儿。

ragflow v0.25.6 发布:Browser 自主浏览、RAPTOR 升级、Agent 体验增强与大量稳定性修复全解析

一、版本概览

这次发布的 v0.25.6 版本(2026年5月26日),从覆盖面上看,根本不像是一个小版本迭代,它几乎把 Agent、RAG、API、Go 驱动、文档解析、异步调度、权限安全、国际化 这些核心模块全给“清洗”了一遍。

说它是单点补丁?那可太小看它了。这是一次明显偏向 能力补齐、体验增强、问题修复、生态扩展 的综合升级。

具体来说,最值得关注的有这么几个方向:

  • Agent 新增 Browser 组件,让 AI 能像个真人一样浏览和操作网页
  • RAG RAPTOR 构建升级到 AHC 模式,把语义扩展的格局从文档级别拉到了数据集级别
  • Agent 新增轻量级 @tool 装饰器,注册 Python 函数变得前所未有的简单
  • Agent 消息支持显示 base64 图片,告别纯文本的单调
  • Doc Generator 文件元数据可作为独立变量暴露,工作流灵活度更高
  • Agent chat completion 支持传入 chat_template_kwargs,对话控制更精细
  • /chat/completions 接口支持只发送最新消息,API 调用更轻量
  • 检索阶段向量相似度权重被修复,排序和召回终于回归正轨
  • 大量异步、解析器、表格、HTML、日志、文档状态、空响应等问题被修复
  • Go 侧能力大规模补齐,模型生态持续扩张
  • 安全性增强,SSRF、user_id 伪造、敏感字段泄露统统被堵上
  • 国际化完善,法语翻译补齐了约 1400 个缺失键
  • 最低 Python 版本提升到 3.13

废话不多说,咱们就按这次更新的内容,一个一个来拆解。

二、新功能:Agent 新增 Browser 组件

要说这次更新最“炸”的新功能,那绝对是 Agent 里新增的 Browser 组件

这个组件的核心能力是什么?就是 让 AI 能够自主地浏览网页,并且与它交互

它意味着 Agent 不再是那个“你喂它什么,它吃什么”的被动工具,而是具备了更强的主动操作能力。以后,涉及到需要访问网页、点击按钮、填写表单、获取在线信息的场景,Agent 终于可以自己上手了。这对于构建真正“智能”的自动化助手来说,是一次关键的补强。

从这次发布的说明来看,这是 v0.25.6 最具代表性的新增特性,没有之一。

三、RAG 改进:RAPTOR 构建引入 AHC 模式

RAG 方面,这次对 RAPTOR 构建 做了个“大手术”,引入了 AHC 模式(Ψ-RAG)。这个升级不是一个简单的修修补补,而是重构了索引构建的底层逻辑。

1. 语义扩展维度升级

AHC 模式最大的不同在于,它把语义扩展从 文档级别 提升到了 数据集级别。这意味着索引时,它会从整个数据集的角度去理解语义,而不是局限于单个文档内部。这样做的结果,就是构建出来的语义结构更具全局性和代表性。

2. 构建性能提升

根据官方说明,新模式的索引构建性能要显著高于旧版 RAPTOR。而且,不仅仅是快,在 Recall@5平均 F1 这两个关键指标上,也都优于旧版本。一句话概括:又快又准

3. 支持模式切换

系统并不是一刀切,用户可以在 AHCGMM 模式之间自由切换。这为不同场景下的策略选择留出了空间,非常灵活。

4. 本版本修复问题

这个特性并非在 v0.25.6 才首次引入,它早在 v0.25.3 就有了雏形。本次更新主要是在此基础上,修复了多个相关 Bug,让整个模块变得更稳定、更可靠。

四、Agent 改进:轻量级 @tool 装饰器

作为开发者,你们一定会爱上这个更新。这次版本新增了一个 轻量级 @tool 装饰器

它的目标非常明确:简化 Python 函数注册流程。以前,要把一个 Python 函数挂载给聊天模型使用,可能需要写不少样板代码。现在,一个简单的装饰器就能搞定,开发效率瞬间提升。这是 Agent 工程化体验上一个非常务实且有效的优化。

五、Agent 改进:消息支持显示 base64 图片

Agent 的交互方式终于不局限于“纯文本”了。现在,Agent 消息 支持显示 base64 编码的图片

这在需要图文混排、截图展示、视觉信息传递的场景下,价值巨大。比如,Agent 可以分析一张截图并直接展示出来,而不是干巴巴地描述“这张图里有什么”。

六、Agent 改进:Doc Generator 文件元数据作为独立变量暴露

这次版本还对 Doc Generator 组件进行了改进。现在,文档生成器在处理文件时,其 文件元数据 可以作为一个 独立的变量 暴露出来。这意味着,你在编排工作流时,可以更精细、更自由地访问和使用这些元信息,比如文件名、来源、创建时间等,极大地提升了工作流的灵活性。

七、Agent 改进:支持传入 chat_template_kwargs

Agent 的 chat completion 接口现在开放了 chat_template_kwargs 参数。这相当于给了开发者一把“钥匙”,可以在构建对话请求时,对模型内部的模板参数进行更细粒度的控制。这对于需要微调对话行为、注入特定上下文的高级玩法来说,是个不小的增强。

八、接口修复:/chat/completions 允许只发送最新消息

这是个非常实用的修复。/chat/completions 接口现在允许在请求体中只发送最新的消息,不再强制要求携带完整的对话历史

这意味着什么?

  • API 调用变得更加轻量
  • 请求体更简洁
  • 更符合“只传当前轮输入”的调用习惯
  • 在实际集成中,这种方式也更常见、更高效

能看出来,官方团队在 API 设计的人性化上,是下了功夫的。

九、检索修复:向量相似度权重在检索阶段未生效

必须要提的是,这次版本修复了一个直接影响检索质量的问题:向量相似度权重在检索阶段没有被正确应用

这种问题属于“暗病”,不直接报错,但会潜移默化地影响检索结果的排序和召回质量。修复之后,配置的权重参数终于能生效了,检索行为才算是真正回到了我们预期的主线上。

十、数据集与配置页面修复

日常运维中,一些“小毛病”最烦人。这次版本也集中清理了一波:

  • 解析器配置保存失败:数据集配置页面中,parser configs 无法保存的问题已被修复。
  • 数据源详情页日志显示不完整:日志信息终于能完整展示,排查问题更方便。
  • 文档状态过滤失败:document status filtering failure 的问题也得到了解决。

这些都是直接影响日常操作体验的痛点。

十一、空响应与解析修复

底层健壮性方面也做了不少功课:

  • 修复了 空 LLM choices response 时的崩溃防护问题
  • 修复了 HTML 标签在 ingestion pipeline parser output 中残留 的问题
  • 修复了 table parser metadata 的问题
  • 修复了 空文件 的报错提示,让错误信息更清晰

这些改进共同提升了数据摄入和解析链路的稳定性。

十二、RAG RAPTOR 相关修复

除了 AHC 模式升级,RAPTOR 还修复了一个关键兼容问题:使用 Infinity document engine 时,RAPTOR 构建过程会停止。现在,这个“拦路虎”已经被移除,RAPTOR 在不同文档引擎下的兼容性更好了。

十三、流式响应解析修复

修复了 Mistral / Upstage reasoning models 的流式响应解析问题。这主要影响模型在流式输出时的稳定性,修复后,使用这些推理模型时,体验会更流畅。

十四、异步与事件循环问题修复

针对 asyncio 相关问题做了一次集中修复,包括:

  • 修复 asyncio event loop nesting
  • 修复 fire-and-forget task 问题
  • 修复 asyncio.Semaphore bound to different event loop 错误

这些在平时开发中可能不太常见,但在高并发、异步任务调度的场景下,每一个都是潜在的定时冲击波。修复后,系统的整体稳定性会有显著提升。

十五、Agent 相关 bug 修复

Agent 也有多项针对性修复:

  • 修复 Agent component prompt variable 消失 的问题
  • 修复 search vector_similarity_weight 相关问题
  • 修复 agent attachment download api 的移动问题
  • 修复 agent 创建与更新 API 中 canvas_type 的支持问题

这些都属于 Agent 功能细节上的关键修正,确保了核心功能的稳定性。

十六、API 与安全性增强

安全是底线。这次版本在安全方面下了大力气:

  • session user_id 伪造修复:堵住了通过 request body 伪造用户身份的漏洞。
  • /dify/retrieval 权限校验:修复了知识库所有权校验的问题,防止越权访问。
  • 敏感字段泄露防护:用户 API 响应中不再泄露敏感字段。
  • SSRF 防护:修复了 misc_utils.download_img 在处理 OAuth 头像时的 SSRF 风险。

可以说,本次版本对安全性进行了明显的加固。

十七、文档与工具能力修复

文档相关能力也有不少更新:

  • /documents/{id}/download 相关问题的修复与回退
  • 解析器输出中的 HTML 标签 被清理
  • PDF 文档顶部红色高亮替换为黄色,更清晰易读
  • chunk 标签列表显示 问题修复
  • 提供了 chunk management、chat assistant、retrieval 的 SDK 和 cURL 示例,开箱即用感更强
  • metadata 相关问题修复

十八、Go 侧能力大规模补齐

这次更新,Go 驱动的模型生态堪称大爆发,覆盖了 provider、embed、rerank、ASR、TTS、OCR 等多个维度。

1. 新增或补充的 provider / driver

  • TogetherAI
  • n1n.ai
  • GPUStack(chat)
  • Azure OpenAI 模型驱动
  • PPIO provider
  • Groq provider
  • Tencent Hunyuan provider
  • TokenPony provider
  • HuaweiCloud model provider
  • ModelScope provider
  • OrcaRouter provider
  • FuturMix provider
  • TokenHub provider
  • AWS Bedrock provider

2. 新增 embed 能力
TogetherAI embed、Xinference embed、Tencent Hunyuan embed

3. 新增 rerank 能力
Xinference rerank、Novita rerank、DeepInfra rerank、TogetherAI rerank

4. 新增 ASR / TTS 能力
Xinference ASR/TTS、TogetherAI ASR/TTS、ZhipuAI ASR、OpenRouter ASR、Groq reasoning_chat/TTS/ASR

5. 新增 OCR 能力
ZhipuAI OCR、Baidu OCR 输入校验、PaddleOCR_Local provider、通过 drivers 路由的 hosted OCR providers

6. 其他 Go 侧能力
OpenAI audio endpoints 支持、Ollama 的 chat/listmodels/embed 重写、Elasticsearch functions in Go

可见,Go 生态在 v0.25.6 中得到了全面的扩充,几乎覆盖了主流的模型服务和多模态任务。

十九、Evaluation 与测试增强

研发质量方面也有跟进:

  • evaluation 中增加 token usage 跟踪
  • 增加新的 restful api suite 测试与测试用例
  • 改进 retry 和 timeout
  • 改进 CI

这些工作是保证项目长期健康发展的重要基石。

二十、国际化与文档更新

版本维护和社区支持上也在持续推进:

  • Python 最低版本要求提升至 3.13
  • 更新 README 和文档中的版本引用到 v0.25.6
  • 更新 v0.25.5 发布说明
  • 完成 Discord 集成指南
  • 初稿与草稿形式的 v0.25.6 发布说明同步完善
  • 法语翻译补齐约 1400 个缺失键

二十一、其他修复与完善

除了上述大项,还有大量细节修复,覆盖了前后端、API、任务调度、解析链路和安全边界多个层面:

  • 修复 API 路径错误
  • 修复 任务语言缺失
  • 修复 模型类型加入 llm_setting
  • 修复 OpenAI chat completion 与 session_id / conversation_id 关联问题
  • 修复 文档下载内容类型推断相关问题后回退
  • 修复 数据源详情日志显示不完整
  • 修复 表格解析 metadata
  • 修复 PDF 高亮颜色
  • 修复 空文件报错信息
  • 修复 tag list 显示
  • 修复 parser config 保存问题
  • 修复 restful api suite 测试
  • 修复 agent attachment download API
  • 修复 search vector_similarity_weight
  • 修复 prompt variable 消失
  • 修复 canvas_type 支持
  • 修复 敏感字段泄露
  • 修复 SSRF
  • 修复 empty LLM choices
  • 修复 event loop 相关问题

二十二、版本总结

代码地址:github.com/infiniflow/ragflow

总的来说,ragflow v0.25.6 是一次几乎无死角的版本更新。它集齐了功能增强、性能优化、问题修复和生态扩张四大要素,对于任何正在使用或评估 RAGFLOW 的团队来说,都绝对值得立即升级。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策