自研模型

Rerank Memory

提供记忆重排接口,基于 memos-reranker 小模型,传入用户查询与候选记忆列表,一键完成记忆相关性重排。

POST
/
rerank
import os
import requests
import json

# 替换成你的 API Key
os.environ["MEMOS_API_KEY"] = "YOUR_API_KEY"
os.environ["MEMOS_BASE_URL"] = "https://memos.memtensor.cn/api/openmem/v1"

url = f"{os.environ['MEMOS_BASE_URL']}/rerank"

payload = {
    "model": "memos-reranker-0.6b",
    "query": "用户有什么兴趣爱好",
    "documents": [
        "用户喜欢打羽毛球",
        "用户在杭州做后端开发",
        "用户偏好简洁的回复风格",
        "用户比较喜欢酱香型白酒",
        "用户下周三要去北京出差"
    ]
}

headers = {
    "Content-Type": "application/json",
    "Authorization": f"Token {os.environ['MEMOS_API_KEY']}"
}

response = requests.post(url, headers=headers, data=json.dumps(payload))
print(response.json())
{
  "id": "<string>",
  "model": "<string>",
  "usage": {
    "prompt_tokens": 0,
    "total_tokens": 0
  },
  "results": [
    {
      "index": 0,
      "document": {
        "text": "<string>"
      },
      "relevance_score": 0
    }
  ]
}

Authorizations

Authorization
string
header
required

Token API_key,可在 API 控制台>接口密钥 中查看

请求体

application/json
model
string
模型名称。
Enum:"memos-reranker-0.6b""memos-reranker-4b"
query
string
required
用户查询文本,用于与候选文档进行相关性匹配。
documents
string[]
required
候选记忆/文档列表,每条为一段文本。数组中所有文档的总 token 数上限为 8k。
top_n
number
返回前 N 条最相关的结果。不传时默认返回全部结果。

响应体

application/json

Successful Response

id
string
required

本次请求的唯一标识。

model
string
required

使用的模型名称。

usage
object
required

token 用量统计。

展示属性
results
RerankResult·object[]
required

重排结果列表,按 relevance_score 降序排列。

展示属性