文章

RAGFlow0.25版本更新与记忆工作流简介

RAGFlow0.25版本更新与记忆工作流简介

RAGFlow0.25版本更新与记忆工作流简介

本文归纳 RAGFlowv0.20.0 起至 v0.25.0 区间在官方发布说明中的主要功能与重大变更,并单独说明 Memory(记忆) 模块的定位、配置要点与可落地的 Agent 工作流(含文字箭头流程图)。具体子版本与修复项繁多,官方 Release notes各版本 GitHub Release为准;升级前务必阅读对应版本的 Breaking changes / 数据库迁移 说明。


目录


一、信息来源与版本跨度

  • 官方 Release notes:[ReleasesRAGFlow](https://www.ragflow.io/docs/release_notes)
  • GitHub 标签页infiniflow/ragflow Releases
  • Memory 使用说明:[Use memoryRAGFlow](https://www.ragflow.io/docs/use_memory)

本文讨论的「0.20.0 到 0.25.0 之间」包含 0.20.x 补丁线0.21.0~0.25.0 的主线功能;0.20.0 本身是一次 Agent 体系大改版的起点,后文会单独强调。


二、按版本的功能速览(0.20.x~0.25.0)

版本发布时间(以官方为准)功能与变更摘要
v0.20.02025-08-04兼容性:旧版 Agent 不再兼容,升级后需重建新能力:Agent 与 Workflow 统一编排、Agent 大重构(多 Agent、规划与反思、可视化)、MCP 全链路、运行时日志、聊天历史管理、新版 Infinity 与自动打标签等。
v0.20.1~0.20.52025-08~09多为 Agent/检索/模板/模型 增补与修复;如 Retrieve chunks 增加 metadata_condition、动态指定数据集、框架级 System prompt 块、GraphRAG 超时等(详见各版 release)。
v0.21.02025-10-15可编排入库流水线(Ingestion pipeline)GraphRAG/RAPTOR 改为手动批量构建长上下文 RAG(文档级 TOC 模板)、视频解析Admin CLI、新模板与 Infinity v0.6.0 等。
v0.21.12025-10-23MinerU 解析 PDF(实验性)、Infinity v0.6.1、数据集与个人中心 UI 等。
v0.22.02025-11-12Breaking:仅提供 slim 无嵌入镜像、不再-slim 后缀区分。新能力:多在线数据源同步(S3、Google Drive、Notion、Confluence、Discord)、RAPTOR 可按整库或单文档构建、Agent 结构化输出、Retrieval 元数据过滤、Variable aggregator 等。
v0.22.12025-11-19Flask 异步化、List operations / Variable aggregator、S3 兼容源、JIRA 同步、导出 Word/Markdown 等;修复 -full 版解析/换嵌入等问题。
v0.23.02025-12-27Memory 管理界面上线;Retrieval / Message 可配置 Memory 上下文;Agent 架构优化Webhook语音、单 Agent 多 Retrieval入库流水线 Transformer 支持 TOC父子分块、解析时自动生成元数据GraphRAG 加速Infinity v0.6.15;大量数据源与模型扩展。
v0.23.12025-12-31Memory 全类型抽取稳定性;空 Memory 导致无法启动、无法删除等修复MDX、GitHub/GitLab/Asana/IMAP 等数据源相关项。
v0.24.02026-02-10Memory 管理 API(HTTP + Python)、抽取日志输出控制台;批量元数据PageIndex(原 ToC 命名调整);类 Chat 的 Agent 会话管理多 Sandbox(本地 gVisor / 阿里云等);Chat Thinking 模式、深度检索优化;OceanBase 作 MySQL 替代;新模型与数据源等。
v0.25.02026-04-21(GitHub)入库流水线:7 套内置模板、解析增强;数据源:Seafile、RSS、钉钉 AI 表格等及删除同步Agent 发布、沙箱内代码执行与图表数据分析 Agent 模板;用户级 Memory 存储与检索(发布说明表述);移动端嵌入页;默认 MinIO 镜像调整;数据库升级脚本;DocEngine 支持 Elasticsearch 9.x;新模型与厂商;与 OpenClaw 等生态说明等。

三、重大更新归纳

下列条目在产品形态、部署或研发集成上影响面较大,可视为「重大」或需重点阅读发行说明的更新(非严格排名)。

  1. v0.20.0:Agent/Workflow 统一与 MCP
    • 与旧版 Agent 不兼容、必须重建;统一编排 + MCP 全链路,相当于平台代际切换
  2. v0.21.0:可编排入库 + GraphRAG/RAPTOR 构建方式 + 长文 TOC
    • 数据进入知识库的方式产品化;长文档 RAG 通过 TOC/PageIndex 思路缓解切块带来的上下文丢失。
  3. v0.22.0:Docker 发行策略 Breaking + 在线数据源 + RAPTOR 粒度
    • 部署镜像策略变化影响所有依赖 full 镜像习惯的用户云同步RAPTOR 按库/按文档 扩展了运维与知识工程选项。
  4. v0.23.0:Memory 首版 + Agent 能力面(Webhook、语音、多 Retrieval)+ 入库流水线与分块
    • 记忆Agent 编排 进入可配置闭环;与后续 API 形成前后衔接。
  5. v0.24.0:Memory API + 多 Sandbox + Agent 会话体验
    • 程序化管理记忆、隔离执行环境、会话与「思考」模式等,偏向企业落地与可观测性
  6. v0.25.0:Agent 发布、流水线模板强化、用户级 Memory、DB 升级与生态
    • 对外发布 Agent数据分析模板、用户级记忆DB 迁移脚本 等,对生产发布与升级路径要求高。

说明:v0.25.0 在 GitHub Release 正文中另有 Memory API 网关/服务分层安全相关修复 等大量 PR,运维与安全团队宜对照 完整 changelog 评估。


四、Memory 模块:做什么、怎么配

根据官方 Use memory

  • 定位:在 Agent 运行过程中持久化对话与衍生信息(摘要、笔记等),并把内容整理为不同类型,使后续对话能召回用户事实、经历与任务上下文,减少重复与跑题。
  • 类型(创建时可勾选抽取维度):
    • Raw:原始对话(默认必需)。
    • Semantic Memory:与用户/世界相关的事实与常识性条目。
    • Episodic Memory:带时间色彩的事件与经历记录。
    • Procedural Memory技能、习惯、流程化经验。

创建与配置路径Overview → Memory 中新建;在某一 Memory 的 Configuration 中设置:

配置项含义
Name唯一名称。
Embedding model将记忆条目向量化所用嵌入模型。
LLM从原始对话中抽取与整理记忆所用对话模型。
Memory type勾选要抽取的类型(见上)。
Memory size默认约 5MB(官方给出与 embedding 维度的占用估算)。
Permission仅本人团队 共享。

在 Agent 中启用(与检索闭环)

  • Retrieval 组件:配置为从指定 Memory 读取(与知识库检索并列,用于把历史记忆拉回上下文)。
  • Message 组件:配置 Save to Memory,把本轮需沉淀的内容写入同一或指定 Memory。

官方强调:凡使用 Memory 的 Agent,通常需要配套 Retrieval 才能把记忆读回对话


五、记忆功能工作流示例与流程图

以下三个示例均基于官方描述的 「Retrieval 读 Memory + Message 写 Memory」 模式;画布上具体节点名称以你当前 RAGFlow UI 为准。

5.1 示例一:客服机器人「越聊越懂你」

业务目标:用户多次咨询退换货政策;系统记住已核实过的订单号、偏好渠道,避免用户重复输入。

1
2
3
4
5
6
7
用户发消息
    → Message 节点(对话模型回复)
    → 分支:若本轮包含可沉淀事实(订单号、结论)
            → Message「Save to Memory」写入 Memory-A
    → 下一轮用户再问
            → Retrieval(知识库 + Memory-A)并行或串行召回
            → Message 生成回答(带记忆上下文)

文字要点:首次对话写入 Episodic / Semantic;后续 Retrieval 同时命中 FAQ 知识库Memory-A 中的订单事实。


5.2 示例二:内部知识助手 + 会议结论沉淀

业务目标:检索公司制度(数据集)同时,把每次会议结论写入团队共享 Memory。

1
2
3
4
5
6
开始(用户提问)
    → Retrieval-1:数据集「制度库」
    → Retrieval-2:Memory「团队纪要」(Permission=Team)
    → 合并上下文 → LLM 回答
    → 若用户指令「记录本次会议结论」
            → Message → Save to Memory「团队纪要」

流程图(箭头)

1
2
3
4
5
6
7
8
9
10
11
12
13
[用户输入]
    ↓
[Retrieval: 制度数据集]
    ↓
[Retrieval: 团队 Memory] ──→ [合并上下文]
    ↓                              ↓
[LLM 生成答复] ←───────────────────┘
    ↓
[用户确认「写入纪要」]
    ↓
[Message: Save to Memory]
    ↓
[Memory 条目更新,供下次 Retrieval]

5.3 示例三:仅「读记忆」的只读助手(不写回)

业务目标:上线前只想用已有 Memory 做个性化,不允许自动写入。

1
2
3
4
5
6
7
8
9
[用户输入]
    ↓
[Retrieval: Memory-B(只读)]
    ↓
[Retrieval: 业务知识库]
    ↓
[LLM]
    ↓
[结束]   (不在 Message 上配置 Save to Memory)

适用于记忆由管理员人工整理导入仅消费历史会话导出的场景。


5.4 运维与治理(与版本相关)

  • v0.23.1 起修复了「空 Memory 导致服务起不来」「空 Memory 删不掉」等问题;生产环境应避免创建无配置的空 Memory,并定期在 Memory 管理页清理/遗忘条目(官方说明:手动遗忘的条目不再参与 Agent 召回)。
  • v0.24.0 起可通过 HTTP/Python API 做记忆管理自动化(具体路径见 HTTP API reference 与 Python 文档)。
  • v0.25.0 发布说明提到 用户级 MemoryMemory API 分层重构;集成方需关注接口路径或网关行为是否与旧版一致,以当前文档为准

六、升级与排障提示

  • 跨 0.20.0:旧 Agent 必须重建;若有历史工作流,需按官方迁移说明重做。
  • 跨 0.22.0:Docker 仅 slim、无嵌入镜像策略变化;依赖 -full 内置嵌入 的环境需改部署方式。
  • 跨 0.25.0:关注 数据库升级脚本默认 MinIO 镜像变更、Elasticsearch 9.x 等与运维相关的条目。
  • Memory:升级后若遇 抽取失败或 API 404,先查 Release notes 中 Memory 相关修复版本,并对照 Use memoryShare memory 文档检查 权限与 Retrieval/Message 绑定

七、参考链接

  1. RAGFlow Release notes(官方)
  2. RAGFlow Changelog
  3. infiniflow/ragflow Releases(GitHub)
  4. [Use memoryRAGFlow](https://www.ragflow.io/docs/use_memory)
  5. Retrieval 组件说明
  6. Message 组件(Agent 组件参考)
  7. HTTP API Reference
  8. v0.25.0 Release(GitHub)
  9. [Share memoryRAGFlow](https://www.ragflow.io/docs/share_memory)

文档与界面随版本迭代,若链接锚点变更,请从 RAGFlow 文档首页重新导航。

本文由作者按照 CC BY 4.0 进行授权