基于ID的RAG FastAPI

概述

本项目以异步、可扩展的方式将Langchain与FastAPI集成，提供了一个文档索引和检索的框架，使用PostgreSQL/pgvector。

文件按file_id组织成嵌入向量。主要用例是与LibreChat集成，但这个简单的API可用于任何基于ID的场景。

使用ID方法的主要原因是在文件级别处理嵌入向量。当与存储在数据库中的文件元数据结合使用时（如LibreChat所做的那样），这使得查询更有针对性。

随着时间的推移，API将不断发展，采用不同的查询/重新排序方法、嵌入模型和向量存储。

功能

文档管理：添加、检索和删除文档的方法。
向量存储：利用Langchain的向量存储进行高效的文档检索。
异步支持：提供异步操作以增强性能。

设置

入门

根据下面的部分配置.env文件
设置pgvector数据库：
- 运行现有的PSQL/PGVector设置，或者，
- Docker：docker compose up（同时启动RAG API）
  - 或者，仅使用docker运行数据库：docker compose -f ./db-compose.yaml up
运行API：
- Docker：docker compose up（同时启动PSQL/pgvector）
  - 或者，仅使用docker运行RAG API：docker compose -f ./api-compose.yaml up
- 本地运行：
  - 确保将DB_HOST设置为正确的数据库主机名
  - 运行以下命令（最好在虚拟环境中）

pip install -r requirements.txt
uvicorn main:app

环境变量

运行应用程序需要以下环境变量：

RAG_OPENAI_API_KEY：OpenAI API嵌入的API密钥（如果使用默认设置）。
- 注意：OPENAI_API_KEY也可以使用，但RAG_OPENAI_API_KEY会覆盖它，以避免与LibreChat设置冲突。
RAG_OPENAI_BASEURL：（可选）OpenAI API嵌入的基础URL
RAG_OPENAI_PROXY：（可选）OpenAI API嵌入的代理
VECTOR_DB_TYPE：（可选）选择向量数据库类型，默认为pgvector。
POSTGRES_DB：（可选）PostgreSQL数据库名称，当VECTOR_DB_TYPE=pgvector时使用。
POSTGRES_USER：（可选）连接PostgreSQL数据库的用户名。
POSTGRES_PASSWORD：（可选）连接PostgreSQL数据库的密码。
DB_HOST：（可选）PostgreSQL数据库服务器的主机名或IP地址。
DB_PORT：（可选）PostgreSQL数据库服务器的端口号。
RAG_HOST：（可选）API服务器将运行的主机名或IP地址。默认为"0.0.0.0"
RAG_PORT：（可选）API服务器将运行的端口号。默认为8000端口。
JWT_SECRET：（可选）用于验证请求JWT令牌的密钥。
- 该密钥仅用于验证。这种基本方法假设JWT由其他地方签名。
- 省略以运行API而不需要身份验证
COLLECTION_NAME：（可选）向量存储中集合的名称。默认值为"testcollection"。
CHUNK_SIZE：（可选）文本处理的块大小。默认值为"1500"。
CHUNK_OVERLAP：（可选）文本处理期间块之间的重叠。默认值为"100"。
RAG_UPLOAD_DIR：（可选）上传文件存储的目录。默认值为"./uploads/"。
PDF_EXTRACT_IMAGES：（可选）一个布尔值，指示是否从PDF文件中提取图像。默认值为"False"。
DEBUG_RAG_API：（可选）设置为"True"以在服务器控制台显示更详细的日志输出，并启用postgresql数据库路由
CONSOLE_JSON：（可选）设置为"True"以 JSON 格式记录日志，用于云日志聚合
EMBEDDINGS_PROVIDER：（可选）可选择"openai"、"azure"、"huggingface"、"huggingfacetei"或"ollama"，其中"huggingface"使用 sentence_transformers；默认为"openai"
EMBEDDINGS_MODEL：（可选）从配置的提供商中设置有效的嵌入模型。
- 默认值
- openai："text-embedding-3-small"
- azure："text-embedding-3-small"（将用作您的 Azure 部署）
- huggingface："sentence-transformers/all-MiniLM-L6-v2"
- huggingfacetei："http://huggingfacetei:3000"。Hugging Face TEI 使用 TEI 服务启动时定义的模型。
- ollama："nomic-embed-text"
RAG_AZURE_OPENAI_API_VERSION：（可选）默认为 2023-05-15。Azure OpenAI API 的版本。
RAG_AZURE_OPENAI_API_KEY：（可选）Azure OpenAI 服务的 API 密钥。
- 注意：AZURE_OPENAI_API_KEY 也可以使用，但 RAG_AZURE_OPENAI_API_KEY 将覆盖它，以避免与 LibreChat 设置冲突。
RAG_AZURE_OPENAI_ENDPOINT：（可选）Azure OpenAI 服务的端点 URL，包括资源。
- 示例：https://YOUR_RESOURCE_NAME.openai.azure.com。
- 注意：AZURE_OPENAI_ENDPOINT 也可以使用，但 RAG_AZURE_OPENAI_ENDPOINT 将覆盖它，以避免与 LibreChat 设置冲突。
HF_TOKEN：（可选）如果使用 huggingface 选项时需要。
OLLAMA_BASE_URL：（可选）默认为 http://ollama:11434。

在运行应用程序之前，请确保设置这些环境变量。您可以在 .env 文件中或作为系统环境变量进行设置。

使用 Atlas MongoDB 作为向量数据库

除了使用默认的 pgvector，我们还可以使用 Atlas MongoDB 作为向量数据库。要实现这一点，请设置以下环境变量：

VECTOR_DB_TYPE=atlas-mongo
ATLAS_MONGO_DB_URI=<mongodb+srv://...>
MONGO_VECTOR_COLLECTION=<collection name>

ATLAS_MONGO_DB_URI 可以与 LibreChat 使用的相同或不同。即使相同，$MONGO_VECTOR_COLLECTION 集合也需要是一个全新的集合，与 LibreChat 使用的所有集合分开。此外，为 $MONGO_VECTOR_COLLECTION 创建一个向量搜索索引，使用以下 JSON：

{
  "fields": [
    {
      "numDimensions": 1536,
      "path": "embedding",
      "similarity": "cosine",
      "type": "vector"
    },
    {
      "path": "file_id",
      "type": "filter"
    }
  ]
}

按照四种记录方法之一创建向量索引。

云安装设置：

AWS：

确保您的 RDS Postgres 实例符合以下要求：

pgvector 扩展版本 0.5.0 可用于在所有适用的 AWS 区域（包括 AWS GovCloud（美国）区域）中运行 PostgreSQL 15.4-R2 及更高版本、14.9-R2 及更高版本、13.12-R2 及更高版本和 12.16-R2 及更高版本的 Amazon RDS 数据库实例。

要使用 RAG API 设置 RDS Postgres，您可以按照以下步骤操作：

使用提供的 AWS 文档创建 RDS 实例/集群。
使用 RDS 控制台或您的 IaC 解决方案输出中的终端节点连接字符串登录到 RDS 集群。
登录是通过主用户进行的。
为rag_api创建一个专用数据库： create database rag_api;
为该数据库创建一个专用用户/角色： create role rag;
切换到你刚刚创建的数据库：\c rag_api
启用Vector扩展：create extension vector;
使用上面提供的文档设置连接到RDS Postgres实例/集群的连接字符串。

注意事项：

即使你是以主用户身份登录，它也没有所有的超级用户权限，这就是为什么我们不能使用命令：create role x with superuser;
如果你不启用扩展，rag_api服务将会抛出一个错误，表示由于上述原因无法创建扩展。

开发者注意事项：

安装pre-commit格式化工具

运行以下命令安装pre-commit格式化工具，它使用black代码格式化器：

pip install pre-commit
pre-commit install

rag_api

基于ID的RAG FastAPI

概述

功能

设置

入门

环境变量

使用 Atlas MongoDB 作为向量数据库

云安装设置：

AWS：

开发者注意事项：

安装pre-commit格式化工具

编辑推荐精选

扣子-AI办公

堆友

码上飞

Vora

Refly.AI

酷表ChatExcel

TRAE编程

AIWritePaper论文写作

博思AIPPT

潮际好麦

探索AI的无限可能

推荐工具精选

TRAE编程

扣子-AI办公

码上飞

商汤小浣熊

讯飞绘文

讯飞绘镜

iTerms

AI云服务特惠

火山引擎

阿里云

腾讯云

华为云

百度智能云

AWS

关注微信公众号