v2.0.14
Bug Fixes
PolarDB数据库:
- 修复polardb get_node和get_nodes的metadata嵌套bug
记忆版本管理:
- 修复记忆版本对同一段memory原文分出的chunks之间也会生效的bug
v2.0.13
Improvements
调度日志分级优化:
- 将高频、重复、逐条打印的日志从 info 下调到 debug,明显降低线上日志噪音和存储压力。
队列日志结构化:
- 本地队列和 Redis 队列日志统一为结构化字段(如 label/item_id/user_id/mem_cube_id/stream),避免大段内容日志,检索和聚合更稳定
调度链路关键路径可观测:
- 补齐“提交 -> 出队 -> 分发”关键节点的摘要日志,定位堆积、分发异常、任务拥堵更快。
v2.0.12
Improvements
服务优化:
- 新增最小线程数抽取为可配置参数,支持运行时动态调整线程池大小,有效控制活跃连接数,避免因瞬时流量激增导致系统负载飙升
v2.0.11
New Features
LLM 与搜索能力:
- 新增 MiniMax 作为 LLM Provider,遵循与 Qwen、DeepSeek 相同的接入模式,通过 OpenAI 兼容 API 对接。
- 新增 Tavily 作为可插拔的互联网搜索后端。通过配置即可启用 Tavily API 进行实时网络搜索,为记忆系统提供外部知识补充能力。
部署与运维:
- 新增 health check API 端点,用于服务状态监控。支持容器编排(如 Kubernetes liveness/readiness probe)和负载均衡器的健康探测。
- 新增生产级 Dockerfile(多阶段构建)和 Kubernetes Helm Chart,包含 MemOS API 服务、Neo4j 图数据库、Qdrant 向量数据库的编排配置,以及 Ingress 和示例 values 文件,支持一键部署到 K8s 集群。
接口能力扩展:
- 此前 delete_memory 接口仅支持按 memory_id 删除。本次更新扩展了删除过滤条件,支持通过 user_id 和 conversation_id 批量删除记忆,并在 API 层增加了过滤参数校验,同时为 PostgreSQL 后端实现了 delete_node_by_params 方法。
Bug Fixes
MCP 与消息处理:
- 修复 MCP add_memory 工具消息格式问题;
- 修复 get_further_suggestion 无法处理 string 类型输入参数的问题。
记忆与反馈:
- 修复用户对记忆执行 feedback 操作后,相关记忆节点被错误归档(archived),导致后续检索时无法命中的问题;
Neo4j:
- 修复 Neo4j 检索后过滤逻辑的问题;
- 修复 Neo4j 嵌套 metadata 写入问题。
v2.0.10
Improvements
PolarDB底层数据库:
- polardb优化升级,针对查询带有多种过滤条件的执行路径进行优化,通过使用新增内核能力改善cpu和内存使用率情况,使得查询能够数倍加速,缓解系统压力。
记忆版本服务优化:
- 记忆版本插件化。
- NLI模型添加高可用。
- memreader处记忆版本增加路由,若无相关记忆召回/召回内容经nli模型全判断为无关,则走旧prompt和模型,否则才走记忆版本插件(qwen-flash)。
v2.0.9
Improvements
记忆版本兼容 feedback:
- Feedback对节点更新时,走记忆版本逻辑,会更新到原节点,并把旧内容推到 history 字段中。
记忆版本优化:
- 记忆版本在冲突消解/重复合并的过程中,全面优化了“恢复过去版本当中的独立事实”这条链路,当前能够更稳定、准确地恢复出独立事实,保留记忆信息完整,并减少由于模型回答不稳定而造成的记忆错乱。
Bug Fixes
记忆版本参数等 bug 修复:
- 记忆版本参数校验、更新后 key 为空、update时间错误的几个 bug 修复。
feedback 问题修复:
- Feedback过程中sources为空的问题修复.
v2.0.8
New Features
新功能:
- 添加记忆时,会自动对冲突/重复记忆进行检测、合并和归档,保留最新记忆内容,并将旧记忆内容放在历史字段中;
Improvements
记忆版本优化:
- 记忆版本功能完全迁移到异步执行,不影响async_mode=true时的addMessage接口时延;
数据库优化:
- 采用信号量实现精细化的并发限流,结合故障连接自动剔除与线程生命周期管理,提升系统在高并发下的稳定性。
- 优化日志级别与内容,保留关键执行轨迹,降低日志写入对数据库性能的影响。
- 通过触发式预热,将热数据加载至缓存,避免冷启动带来的高延迟。
Bug Fixes
记忆快添加的bug:
- 记忆添加时,如果选用了MultiModalStruct,在fast模式下部分情况没有进行embedding操作,导致快速模式记忆无法被搜索到;
多模态记忆bug:
- 对于图片类记忆,修复没有单独解读图片内容的bug。
记忆检索:
- 记忆检索减少重复调用get_by_metadata,降低了记忆检索耗时
记忆版本并发问题修复:
- 记忆版本功能现在在并发add(小于add接口时延的短时间内收到多个add请求,并且add的是相关的记忆)情况下,也会按照时间顺序依次合并处理,而不是fallback到不处理
v2.0.7
Improvements
参数优化:
- search接口和chat接口的参数relativity,用于通过相关性分数来筛选召回的记忆,本次优化将相关性阈值默认值都设置为 0.45
v2.0.6
New Features
检索优化:
- search 阶段新增关键词检索,并且 relativity 仍使用 embedding 的余弦相似度
- Chat 接口加入 relativity 输出字段,用户可以使用 relativity 来控制聊天中的检索阈值
Bug Fixes
问题修复:
- 修复偏好记忆阈值筛选使用字段错误的问题
- 修复了一个导致调用 get_memory 接口时 filter 参数同时传入 field condition 和 AND/OR/NOT 等逻辑操作符时会发生调用失败或卡顿的问题
- 修复一些 LLM extra body 传入问题,兼容 LLM 的 enable thinking 参数输入
v2.0.5
New Features
知识库检索优化:
- 双轨检索:支持“原文+记忆”协同存储与检索,可自定义召回模式。
- 上下文唤醒:支持召回分片前后的上下文,增强长文本语义连贯性。
- 相关性精筛:search 接口新增 relativity 字段(0~1),支持按阈值过滤低质召回。
MindDock:
- 云服务 Skill:新增云服务技能支持及快捷入口。
- Prompt 实时注入:聊天中动态注入 Skill 模块,实现多模型间技能互通。
MCP 记忆删除:
- 当识别删除意图时,同步触发 deleteMemory 与 addFeedback。
Improvements
调度与检索 pipeline 重构:
- Pipeline 重构:检索链路重构为 Search -> Enhance -> Rerank -> Filter 四阶段,由统一 API 调度。
- 调度优化:任务处理器模块化,修复 Redis Streams 序列化及 user_context 传递问题。
Skills 优化:
- Skills 文档本地化:支持技能文档本地存储并生成专属 URL,可通过接口直接下载。
- Skills 生成优化:目前能够从用户添加的历史信息中生成更丰富完整的 skills。
v2.0.4
New Features
核心能力:
- 新增 Skill Memory。
- 新增对记忆版本功能做支持的相关模块。
- 新增 chat/completions 接口,兼容 OAI 协议。
Bug Fixes
问题修复:
- 解决 Playground 新用户 bug。
- 修复云服务添加记忆时偶发的卡顿问题。
- 解决图数据库效率问题。
v2.0.3
New Features
文档:
- 开源项目文档,修复格式、示例描述、中英文不匹配问题,新增使用小 tips。
Dashboard:
- 知识库新增支持文件类型, 支持 json、md、xml。
GitHub 示例仓库:
- 调整启动方式(新建类server router),移除 src/memos/product_api.py 引用。
Improvements
开源项目:
- 优化文字与图片记忆添加,将两类信息作为单条消息协同处理。
- 知识库检索支持 all 字段。
v2.0.2
New Features
发布「知识库问答助手」搭建教程:
- 官方文档更新「基于及知识库开发问答助手」的最佳实践,手把手教你搭建“MemOS 知识库助手”。
Improvements
知识库文档召回:
- 进一步提升检索记忆接口对知识库文档内容细节的召回能力,优化针对文档内容的回答效果。
工具记忆机制:
- 增加针对调用轨迹的程序性经验,提升工具记忆的辅助效果;
- 对工具 schema 信息压缩,避免重复添加 ToolSchemaMemory。
事实记忆合并和归档机制:
- 在事实记忆处理过程中增加了合并与归档机制,优化了记忆重复写入、重复召回的问题,同时保证不影响抽取完整性。
获取记忆接口:
- 支持返回工具记忆;
- 支持返回特定筛选条件下的记忆,用于调试、展示等场景。
Bug Fixes
获取记忆接口:
- 修复了获取记忆接口在入参为 include_preference=False 时的调用错误。
v2.0.1
New Features
Playground更新:
- Playground 记忆管理页支持记忆删除,支持用户手动管理删除不再需要的过期记忆。
Improvements
删除记忆接口:
- 删除记忆接口优化,支持删除所有类型的记忆,包括用户记忆、知识库记忆等。
记忆检索优化:
- search接口支持可选的去重参数,支持语义相似去重以提升检索结果多样性。
Bug Fixes
kv cache问题修复:
- 解决kv cache代码在新版memos中因兼容性问题报错的问题
调度模块问题修复:
- 修复调度启用local模式时因为缺少redis配置而报错的问题
v2.0.0
New Features
知识库与记忆能力:
- 新增知识库功能,支持基于文档与 URL 构建可自我演进的长期记忆体系
反馈与记忆管理:
- 新增记忆反馈与修正能力,支持自然语言调整已有记忆
- 新增删除记忆接口,支持按 memory id 删除指定用户记忆
- MCP 新增记忆删除与反馈能力
对话与检索:
- 新增聊天接口,支持基于历史记忆的检索式回复
- 支持记忆过滤与自定义 tag / info 检索(云服务 & 开源项目)
多模态与工具记忆:
- 新增工具记忆支持,支持工具调用历史的经验抽取与检索
- 新增图片类消息记忆支持,支持对话与文档图片理解
Improvements
数据与基础设施:
- 底层 DB 升级,提升稳定性、连接管理与数据操作性能
调度模块:
- 调度系统重构,引入 Redis Streams 与多级队列隔离机制
- 新增任务优先级、自动恢复与配额调度能力
Bug Fixes
记忆调度与更新任务:
- 修复旧版记忆调度接口兼容性问题,确保用户记忆隔离正确
- 修复记忆更新任务日志异常,确保新增记忆正常展示
v1.1.3
New Features
记忆添加与检索:
- 新增异步添加模式(支持明文与偏好)
- 支持偏好记忆全链路
- 引入 Reranker 策略集
- TreeTextMemory 支持 BM25 检索算法
调度模块:
- API 调度模块化重构
- 优化 Redis ORM 用于历史同步与混合搜索
数据与基础设施:
- PolarDB 图后端增加连接池与超时控制并修复相关问题
- 统一图工厂(支持 Neo4j / PolarDB / Nebula)
- 优化 Milvus 接口与数据项结构
- 增强日志链路与监控信息
- 基于 Nacos 的动态配置管理
评估体系:
- PrefEval 字段标准化
- 升级 LoCoMo / LongMemEval / PrefEval / PersonaMem 评估流程
Improvements
项目框架:
- 更新 API 路由模块
- 增强错误处理与上下文追踪稳定性
Bug Fixes
调度模块:
- 修复查询调度边界条件问题
- 修正消息队列 schema 问题
v1.1.1
New Features
云服务 1.0 内测版发布:
- 🛠️ 开箱即用:无需复杂部署,直接通过云端 API 接入
- 🔄 跨会话记忆:自动召回用户画像、偏好、行为,实现连续个性化
- 📖 Developer-Friendly:文档、示例代码 全面支持
- 🎁 Free Quota:每位开发者均可领取基础额度,方便探索
v1.0.1
New Features
KV-Cache性能优化:
- 更新Kv-Cache在不同GPU部署方案上的对比实验数据
- 优化测试benchmark与统计方式
v1.0.0
Improvements
明文记忆功能:
- 互联网检索接入博查;
- 增加对Nebula数据库的支持;
- 增加对树形明文记忆search接口的上下文理解功能;
v0.2.2
New Features
明文记忆:
- 实现互联网检索接入与 Nebula 数据库支持
- 增强记忆抽取的上下文理解能力
- 上线互联网检索接口,并接入 memreader 处理互联网消息
KV Cache:
- 进行 KV Cache 评测,包括 LMCache 详细调研及性能测试
- 完成 MemOS vllm(0.2.1 版)在特定环境和模型下的压力测试
- 细化 Qwen2.5-72B-Instruct 模型上预载 KV Cache 的 ttft 测试数据并补充进报告
- 结合国产硬件应用,完成高 ROI 推理服务系统的第一版调研与设计
记忆操作模型:
- 完成模型训练评估并发布
- 发布 4b、1.7b、0.6b 模型,支持记忆抽取和整合
Improvements
记忆调度:
- 开展代码重构与功能完善工作
- 重构 monitor、dispatcher、retriever 等功能模块
- 新增 schemas 和 utils 大类代码
- 完善网络日志打印功能
- 增强调度器鲁棒性,新增异常捕获装饰器
- 对部分共享资源加锁
API增强:
- 增加playground上下文支持
- 增强产品API功能
- 重写查询模块
- 添加chat历史功能
Bug Fixes
数据解析:
- 修复日期解析错误
- 修复memos_w_scheduler示例代码问题
- 修复Nebula图数据库的精细搜索bug
- 修复metadata过滤器的获取逻辑
系统集成:
- 对齐MOSProduct._build_system_prompt签名与MOSCore
明文记忆:
- 修复通用文本记忆处理逻辑
- 修复memreader组件问题
v0.2.1
New Features
MemCube功能:
- 新增明文记忆 + KV Cache功能,提供推理解码性能报告
- 完成趣味性cube功能开发,已跑通完整流程,支持embedding模型切换
MemOS系统:
- 发布MemOS Neo轻量级版本,简化架构仅保留核心API模块
- 新增MCP支持,扩展MCP能力
- 构建嵌入Agent流的Pipeline文档,支持Coze框架集成
部署与环境支持:
- 新增Docker部署支持
- API层面支持多模型调用,兼容OpenAI/Qwen/DeepSeek等主流模型
- 完善embedding模型支持
- 新增neo4j社区版/Nebular数据库支持
- 新增单库多租户架构支持
v0.2.0
New Features
官网易用性更新:
- 增加Doc文档搜索框功能
- 增加中英文Doc切换功能
- 增加页脚转换链接和编辑页面
算子模型:
- 新增MemReader-4B小模型,专注记忆抽取操作
- 支持纯本地化部署,适用于受限网络环境
- 实现更低成本和更快速度的记忆操作,性能超越GPT-4o-mini
- 基于Qwen3-4b微调,结合人工和模型标注数据进行监督微调
框架跨平台适配:
- 新增Windows平台部署适配
- 新增Mac平台部署适配
- 完成Linux、Windows、macOS三大主流操作系统适配
- 通过Ubuntu 20.04+/CentOS、Windows 10+/11、macOS 14 Ventura+等平台测试
- 支持核心模块稳定运行(记忆生命周期管理、互操作协议MIP、记忆缓存调度等)
Playground 进展:
- 已完成工程、前端、算法端联调,进行bug修复和调优中