GeneralTextMemory: 通用明文记忆

记忆结构

每个记忆被表达为一个TextualMemoryItem:

字段	类型	描述
`id`	`str`	UUID (如果省略则自动生成)
`memory`	`str`	记忆内容主体 (必填)
`metadata`	`TextualMemoryMetadata`	元数据（用于搜索/过滤）

元数据域 (`TextualMemoryMetadata`)

字段	类型	描述
`type`	`"procedure"`, `"fact"`, `"event"`, `"opinion"`	记忆类型
`memory_time`	`str (YYYY-MM-DD)`	记忆所指的日期/时间
`source`	`"conversation"`, `"retrieved"`, `"web"`, `"file"`	记忆源
`confidence`	`float (0-100)`	确定性/可信度评分
`entities`	`list[str]`	主要实体/概念
`tags`	`list[str]`	主题标签
`visibility`	`"private"`, `"public"`, `"session"`	访问范围
`updated_at`	`str`	最近更新时间戳 (ISO 8601)

所有的值都经过验证，无效的值将引发错误。

搜索机制

与前文提到的NaiveTextMemory 使用关键词匹配算法不同，GeneralNaiveTextMemory 使用向量语义搜索。

与NaiveTextMemory的算法特点对比

特性	关键词匹配	向量语义搜索
理解语义	❌ 不理解同义词	✅ 理解相似概念
资源占用	✅ 极低	⚠️ 需要嵌入模型和向量数据库
执行速度	✅ 快速（O(n)）	⚠️ 较慢（索引构建+查询）
适用规模	< 1K 条记忆	10K - 100K 条记忆
可预测性	✅ 结果直观	⚠️ 黑盒模型

API总结 (`GeneralTextMemory`)

初始化

GeneralTextMemory(config: GeneralTextMemoryConfig)

核心方法

方法	描述
`extract(messages)`	从消息列表中提取记忆 (基于LLM)
`add(memories)`	添加一个或多个记忆 (条目或字典)
`search(query, top_k)`	使用向量相似度检索top-k记忆
`get(memory_id)`	通过ID获取单个记忆
`get_by_ids(ids)`	通过ID获取多个记忆
`get_all()`	返回所有记忆
`update(memory_id, new)`	通过ID更新一个记忆
`delete(ids)`	通过ID删除记忆
`delete_all()`	删除所有记忆
`dump(dir)`	将所有记忆序列化到目录中的JSON文件
`load(dir)`	从存储的文件中加载记忆

文件存储

当调用 dump(dir), 系统会将记忆保存到：

<dir>/<config.memory_filename>

该文件包含所有记忆条目的JSON列表，可以使用load(dir)重新加载.

示例用法

import os
from memos.configs.memory import MemoryConfigFactory
from memos.memories.factory import MemoryFactory

config = MemoryConfigFactory(
    backend="general_text",
    config={
        "extractor_llm": { ... },
        "vector_db": { ... },
        "embedder": { ... },
    },
)
m = MemoryFactory.from_config(config)

# 提取并添加记忆
memories = m.extract([
    {"role": "user", "content": "I love tomatoes."},
    {"role": "assistant", "content": "Great! Tomatoes are delicious."},
])
m.add(memories)

# 通过id手动创建并添加一个记忆
memory_id = "xxx"
m.add(
  [
        {
            "id": memory_id,
            "memory": "User is Chinese.",
            ...
        }
    ]  
)

# 检索记忆
results = m.search("Tell me more about the user", top_k=2)

# 更新记忆
m.update(memory_id, {"memory": "User is Canadian.", ...})

# 删除记忆
m.delete([memory_id])

# 将所有记忆序列化到目录中的JSON文件/从存储的文件中加载记忆
m.dump("tmp/mem")
m.load("tmp/mem")

扩展：互联网检索
GeneralTextMemory 可以与互联网检索结合使用，从网页提取内容并添加到记忆库。
查看示例：从互联网检索记忆

进阶：使用 MultiModal Reader
如果需要处理图片、URL、文件等多模态内容，可以使用 MultiModalStructMemReader。
查看完整示例：使用 MultiModalStructMemReader

开发者注意事项

使用Qdrant（或兼容）向量DB进行快速相似度搜索
嵌入和提取模型是可配置的（支持olama/OpenAI）
/tests中的集成测试涵盖了所有方法。

简单明文记忆

偏好明文记忆