doc-chatbot

doc-chatbot

多功能文档管理与交互聊天平台

doc-chatbot 项目支持多个聊天主题和文件管理,兼容格式包括 .pdf、.docx 和 .txt。用户可以直接在浏览器中上传文件并生成嵌入向量,存储于 Pinecone,并自动保存和检索聊天记录。该项目支持本地开发和部署,提供安全、灵活的 API 设置和完善的错误处理机制,适用于多种应用场景。

GPTPineconeLangChain聊天机器人嵌入存储Github开源项目

项目介绍:doc-chatbot

doc-chatbot 是一个创新的聊天机器人项目,结合了 GPT、Pinecone 和 LangChain 技术,旨在提升互动体验和信息管理能力。以下是对该项目的详细介绍。

项目特点

  • 多主题聊天:用户可以创建多个讨论主题,每个主题都是一个独立的讨论环境。
  • 文件管理:每个主题可以存储无限数量的文件,支持 .pdf.docx.txt 格式。
  • 聊天窗口管理:在每个主题下,可以创建无数个聊天室,让用户更灵活地管理不同话题的讨论。
  • 文件处理:用户可以在浏览器中上传文件,文件会被转化为嵌入表示,存储于特定的命名空间并上传至 Pinecone,还可以随时删除 Pinecone 中的命名空间。
  • 聊天记录管理:支持本地存储所有聊天的历史记录,方便用户随时检索和查看。

使用技术

项目使用了现代化的技术栈,包括:

  • TypeScript
  • Next.js
  • React
  • TailwindCSS

此外,还包含 LangChain 和 Pinecone,用于实现高效的文本处理和存储。

配置与开发

要在本地运行并部署自己的版本,用户需要按照以下步骤进行:

克隆仓库

git clone https://github.com/dissorial/doc-chatbot.git

Pinecone 设置

  1. 创建 Pinecone 账号。
  2. 创建索引,设置维度为 1536。
  3. 获取并配置 API 密钥。

安装依赖

yarn install

环境变量设置

.env.example 文件重命名为 .env,并配置相应的环境变量,例如:

NODE_ENV=development

部署

.env 文件中添加如下配置:

NEXTAUTH_URL=http://localhost:3000 NEXTAUTH_SECRET= JWT_SECRET=
  • NEXTAUTH_SECRETJWT_SECRET 可通过命令生成:openssl rand -base64 32

运行应用

运行以下命令启动开发服务器:

npm run dev

常见问题及解决

  • 确保使用的是最新版本的 Node.js。
  • 对于文件处理错误,尝试将文件转换为文本或更换文件。
  • 设置 Pinecone 时,确认向量维度为 1536,并注意 Starter 免费计划的索引在 7 天不活跃后会被删除。

贡献与来源

此项目源自 GPT-4 & LangChain 仓库,并经过大量改进。前端设计则借鉴了 ChatGPT 的灵感。

doc-chatbot 项目提供了一个灵活强大的框架,不仅仅是一个简单的聊天工具,更是一个信息管理和交互的平台,适合各类需求的用户。通过不断的创新与改进,它致力于为用户提供更流畅的使用体验。

编辑推荐精选

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

堆友

堆友

多风格AI绘画神器

堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

图像生成热门AI工具AI图像AI反应堆AI工具箱AI绘画GOAI艺术字堆友相机
码上飞

码上飞

零代码AI应用开发平台

零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具使用教程AI营销产品酷表ChatExcelAI智能客服
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

数据安全AI助手热门AI工具AI辅助写作AI论文工具论文写作智能生成大纲
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

热门AI工具AI办公办公工具智能排版AI生成PPT博思AIPPT海量精品模板AI创作
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

下拉加载更多