自研模型

Rerank Memory

提供记忆重排接口，基于 memos-reranker 小模型，传入用户查询与候选记忆列表，一键完成记忆相关性重排。

POST

rerank

import os
import requests
import json

# 替换成你的 API Key
os.environ["MEMOS_API_KEY"] = "YOUR_API_KEY"
os.environ["MEMOS_BASE_URL"] = "https://memos.memtensor.cn/api/openmem/v1"

url = f"{os.environ['MEMOS_BASE_URL']}/rerank"

payload = {
    "model": "memos-reranker-0.6b",
    "query": "用户有什么兴趣爱好",
    "documents": [
        "用户喜欢打羽毛球",
        "用户在杭州做后端开发",
        "用户偏好简洁的回复风格",
        "用户比较喜欢酱香型白酒",
        "用户下周三要去北京出差"
    ]
}

headers = {
    "Content-Type": "application/json",
    "Authorization": f"Token {os.environ['MEMOS_API_KEY']}"
}

response = requests.post(url, headers=headers, data=json.dumps(payload))
print(response.json())

curl --request POST \
  --url https://memos.memtensor.cn/api/openmem/v1/rerank \
  --header 'Authorization: Token YOUR_API_KEY' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "memos-reranker-0.6b",
    "query": "用户有什么兴趣爱好",
    "documents": [
        "用户喜欢打羽毛球",
        "用户在杭州做后端开发",
        "用户偏好简洁的回复风格",
        "用户比较喜欢酱香型白酒",
        "用户下周三要去北京出差"
    ]
}'

{
  "id": "<string>",
  "model": "<string>",
  "usage": {
    "prompt_tokens": 0,
    "total_tokens": 0
  },
  "results": [
    {
      "index": 0,
      "document": {
        "text": "<string>"
      },
      "relevance_score": 0
    }
  ]
}

Authorizations

Authorization

string

header

required

Token API_key，可在 API 控制台>接口密钥中查看

请求体

application/json

model

string

模型名称。

Enum:"memos-reranker-0.6b""memos-reranker-4b"

query

string

required

用户查询文本，用于与候选文档进行相关性匹配。

documents

string[]

required

候选记忆/文档列表，每条为一段文本。数组中所有文档的总 token 数上限为 8k。

top_n

number

返回前 N 条最相关的结果。不传时默认返回全部结果。

响应体

application/json

Successful Response

string

required

本次请求的唯一标识。

model

string

required

使用的模型名称。

usage

object

required

token 用量统计。

展示属性

results

RerankResult·object[]

required

重排结果列表，按 relevance_score 降序排列。

展示属性

import os
import requests
import json

# 替换成你的 API Key
os.environ["MEMOS_API_KEY"] = "YOUR_API_KEY"
os.environ["MEMOS_BASE_URL"] = "https://memos.memtensor.cn/api/openmem/v1"

url = f"{os.environ['MEMOS_BASE_URL']}/rerank"

payload = {
    "model": "memos-reranker-0.6b",
    "query": "用户有什么兴趣爱好",
    "documents": [
        "用户喜欢打羽毛球",
        "用户在杭州做后端开发",
        "用户偏好简洁的回复风格",
        "用户比较喜欢酱香型白酒",
        "用户下周三要去北京出差"
    ]
}

headers = {
    "Content-Type": "application/json",
    "Authorization": f"Token {os.environ['MEMOS_API_KEY']}"
}

response = requests.post(url, headers=headers, data=json.dumps(payload))
print(response.json())

curl --request POST \
  --url https://memos.memtensor.cn/api/openmem/v1/rerank \
  --header 'Authorization: Token YOUR_API_KEY' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "memos-reranker-0.6b",
    "query": "用户有什么兴趣爱好",
    "documents": [
        "用户喜欢打羽毛球",
        "用户在杭州做后端开发",
        "用户偏好简洁的回复风格",
        "用户比较喜欢酱香型白酒",
        "用户下周三要去北京出差"
    ]
}'

{
  "id": "<string>",
  "model": "<string>",
  "usage": {
    "prompt_tokens": 0,
    "total_tokens": 0
  },
  "results": [
    {
      "index": 0,
      "document": {
        "text": "<string>"
      },
      "relevance_score": 0
    }
  ]
}

Extract Memory

Get Message