You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
35 lines
1.9 KiB
35 lines
1.9 KiB
---
|
|
title: 记忆
|
|
description: 了解 WealthMentor 如何利用向量数据库管理记忆。
|
|
icon: "brain"
|
|
---
|
|
|
|
# WealthMentor 中的记忆管理
|
|
|
|
在完成设定目标的探索过程中,AI 代理执行大量任务,考虑它们的执行历史。当代理运行时间较长时,记忆管理变得具有挑战性,因为它们的记忆通常与它们的上下文长度一样大。对于 GPT-3.5 和 GPT-4 来说,这大约是 8k - 128k 个标记。
|
|
|
|
## WealthMentor 的记忆困境
|
|
|
|
一旦您的代理运行了几次循环,它们就会忘记之前的行动。我们的解决方案?向量数据库。在这里,我们将代理记忆保存在外部,使其在需要时可以访问。
|
|
|
|
## 什么是向量数据库?
|
|
|
|
这个外部文档 - [Weaviate 文档](https://weaviate.io/developers/weaviate),提供了详细的解释。简而言之,向量数据库使我们能够在外部存储任务执行历史。这样,代理可以通过文本相似性搜索从许多循环之前访问记忆。从本质上讲,人类检索记忆的方式与向量数据库的操作相似。
|
|
|
|
## 为什么选择 Weaviate?
|
|
|
|
Weaviate 是我们的首选向量数据库,原因如下:
|
|
|
|
1. Weaviate 是开源的,并且可以通过 docker-compose 方便地访问,无需在本地 WealthMentor 运行时使用 API 密钥。
|
|
2. 它的云服务可以根据我们的工作负载进行扩展,省去了管理额外基础设施的麻烦。
|
|
3. Weaviate 与 LangChain 等工具无缝集成。
|
|
|
|
然而,如果您对其他数据库有建议,我们鼓励您创建一个工单或拉取请求。
|
|
|
|
## WealthMentor 中的记忆
|
|
|
|
长期记忆的使用仍然在不断发展中。到目前为止,以下是一些应用程序:
|
|
|
|
- 在给定运行中使用的相似任务进行过滤。
|
|
|
|
我们正在积极开发更多应用程序。如果您对记忆管理有有趣的想法,或者希望为其发展做出贡献,请随时联系我们。
|