核心概念

MemOS 将记忆视为一等资源。其核心设计围绕如何为您的 LLM 应用程序组织、存储、检索和治理记忆。

概述

它是什么： 协调多个 MemCube 和记忆操作的组织层。它将您的 LLMs 与结构化、可解释的记忆连接起来，用于推理和规划。

何时使用： 当您需要将用户、会话或代理与一致、可审计的记忆工作流桥接时使用 MOS。

它是什么： MemCube 就像一个灵活、可交换的记忆存储卡。每个用户、会话或任务都可以有自己的 MemCube，它可以容纳一种或多种记忆类型。

何时使用： 随着系统的发展，使用不同的 MemCube 来隔离、重用或扩展您的记忆。

MemOS 将记忆视为一个生态系统——不仅仅是静态数据，而是演进的知识。以下是三种核心记忆类型如何协同工作：

它是什么： 直接嵌入到模型权重中的知识——将其视为模型的"皮层"。它始终开启，提供零延迟推理。

何时使用： 非常适合稳定的领域知识、提炼的常见问题或很少改变的技能。

它是什么： 激活记忆是您模型的可重用"工作记忆"——它包括预计算的键值缓存和隐藏状态，可以直接注入到模型的注意力机制中。将其视为预处理的上下文，让您的 LLM 免于重复重新编码静态或频繁使用的信息。

为什么重要： 通过在 KV cache 中存储稳定的背景内容（如常见问题或已知事实），您的模型可以在预填充阶段跳过冗余计算。这大大减少了首令牌时间 (TTFT) 并提高了多轮对话或检索增强生成的吞吐量。

何时使用：

它是什么： 结构化或非结构化知识单元——用户可见、可解释。这些可以是文档、聊天日志、图节点或向量嵌入。

何时使用： 最适合语义搜索、用户偏好或随时间演进的可追溯事实。支持标签、来源和生命周期状态。

MemOS 让您在生命周期循环中调度所有三种记忆类型：

使用 MemOS，您的 AI 不仅仅是存储事实——它记忆、理解和成长。

深入理解
随着时间的推移，频繁使用的明文记忆可以提炼为参数化形式。很少使用的权重或缓存可以降级为纯文本存储以进行审计和重新训练。

架构设计