概念介绍

常见问题

理解 MemOS 与 RAG、开源方案、私有化部署、记忆生命周期和调度等概念。

这篇页面回答 MemOS 产品和记忆机制相关的问题。如果你已经在使用 MemOS Cloud,并遇到项目、API Key、额度或接口调用问题,请查看 云服务 FAQs配额与限制


MemOS 和普通 RAG 框架有什么区别?

对比维度RAGMemOS
管理对象静态知识片段或文档段落随用户、任务和时间变化的记忆
内容形态通常直接召回原文片段将原始输入加工为事实、偏好等记忆单元
更新方式依赖外部文档更新或重新索引支持持续写入、更新、反馈修正和生命周期管理
召回目标让模型知道外部知识让模型理解用户状态、偏好和上下文

RAG 更适合管理稳定的外部知识;MemOS 更适合管理会在对话和业务过程中持续变化的用户记忆。两者可以配合使用。


MemOS 可以和已有 RAG 或知识图谱结合吗?

可以。RAG 负责事实检索和知识增强,MemOS 负责连续记忆和状态管理。

在业务中,你可以把企业制度、产品说明等稳定内容放在知识库或 RAG 系统中,把用户历史对话、偏好、任务进展等动态信息交给 MemOS 管理。回答时同时召回外部知识和用户记忆,让模型既能参考业务知识,也能理解当前用户。


MemOS 如何工作?

MemOS 的基本流程是:

  1. 通过 add/message、知识库、反馈等方式写入原始信息。
  2. 系统把原始输入加工为可检索、可更新的记忆。
  3. 后续通过 search/memorychat 或 Agent 集成召回相关记忆。
  4. 记忆会随着新输入、反馈和生命周期策略持续更新。

如果你只想快速接入云服务,请从 在应用中集成 开始。


MemOS 核心能力有哪些?

  • 用户 / Agent 记忆管理:保存用户与 AI 的交互内容,并支持多用户、多 Agent 的记忆隔离。
  • 记忆生产与更新:从原始对话、行为事件、知识内容中生成可复用记忆。
  • 记忆召回与调度:按相关性、时效性和上下文选择合适记忆。
  • 记忆生命周期管理:通过更新、合并、归档等方式控制记忆质量和规模。
  • 云服务与开源方案:可以使用托管云服务,也可以基于开源项目自部署和二次开发。

云服务和开源方案怎么选?

如果你希望快速验证、减少运维成本、直接使用控制台、API Key、知识库和额度管理,优先使用 MemOS Cloud

如果你需要自主管理部署环境、修改底层实现、接入自有推理后端或深度二次开发,可以看 开源项目

更完整的对比请看 云服务与开源方案


MemOS 是否支持私有化部署?

支持。需要私有化部署、商业化定制或更深的业务场景适配时,可以联系 MemOS 团队确认部署方式、数据边界和功能范围。

如果你的团队希望自行研究和改造,也可以从开源项目开始。


生命周期和调度有什么关系?

生命周期管理负责记忆单元的状态变化,例如更新、合并、沉淀或归档。调度负责在一次请求中选择哪些记忆进入当前上下文。

简单说:生命周期决定记忆如何长期维护,调度决定当前请求该用哪些记忆。


MemOS 如何避免记忆膨胀?

MemOS 不会把所有原始内容都原样拼接进模型上下文。系统会把原始输入加工为更短的记忆单元,并通过更新、合并、归档等机制控制记忆规模。

后续召回时,MemOS 只选择和当前请求相关的记忆,减少无关内容进入模型。


KV-Cache 和激活记忆是一回事吗?

不是。KV-Cache 是模型推理层的计算缓存;激活记忆是 MemOS 中用于描述近期可快速复用记忆状态的产品概念。

在具体实现上,激活记忆可以利用底层缓存能力提升近期上下文复用效率,但两者不等价。


MemOS 会不会拖慢推理?

MemOS 的目标是通过记忆加工和召回减少无关上下文,而不是把所有历史内容都塞进模型。实际延迟取决于写入量、召回范围、过滤条件、模型调用方式和业务并发。

如果你在云服务调用中遇到额度或延迟问题,请先查看 配额与限制云服务 FAQs


很近的信息,比如“昨天做的事”,还需要调度吗?

需要。时间近不代表一定相关,也不代表可以直接完整塞入上下文。调度会结合当前问题、会话、用户记忆和相关性,选择更适合本轮回答的记忆。


MemOS 适合哪些业务场景?

MemOS 适合需要长期记忆和持续个性化的 AI 应用,例如陪伴、游戏、旅游、客服、知识管理、智能投顾、生产运维和 AI 伴学等场景。

如果你需要评估具体业务场景,可以先用 Cloud API 快速验证,再决定是否做更深的集成或私有化部署。