MindSearch

MindSearch

开源AI搜索引擎框架,支持深度知识探索

MindSearch是一个开源的AI搜索引擎框架,支持Perplexity.ai Pro性能。用户可以使用GPT、Claude等闭源LLM或InternLM2.5-7b-chat等开源LLM,轻松部署类似Perplexity.ai风格的搜索引擎。MindSearch能够解决各种问题,通过浏览数百个网页提供深入的知识,并优化用户界面体验。它通过动态图构建过程,将用户查询分解为多个子问题,逐步扩展搜索图,显著提高响应的深度、广度和准确性。

MindSearchAI搜索引擎知识发现人类偏好开源框架Github开源项目

MindSearch 项目介绍

项目概述

MindSearch 是一个旨在模拟人类思维的深度 AI 搜索器,其目标是通过高级人工智能技术改进搜索体验。该项目不仅提高了搜索能力,还通过创新机制使用户的搜索更加高效和人性化。

项目进展

在 2024 年 11 月 5 日,MindSearch 已经在 Puyu 平台上线,用户可以通过 这个链接 进行体验。此次更新主要包括重构了基于 Lagent v0.5 的代理模块,这使得系统在并发情况下的性能得到了提升。此外,用户界面也进行了改进,支持同时进行多个查询的搜索。

如何构建 MindSearch

步骤一:安装依赖

首先,需要从 GitHub 仓库克隆 MindSearch 项目,并安装所需的 Python 依赖:

git clone https://github.com/InternLM/MindSearch cd MindSearch pip install -r requirements.txt

步骤二:设置环境变量

在设置 API 之前,需要配置环境变量。将.env.example文件重命名为.env,并填写必要的参数。

mv .env.example .env

步骤三:设置 MindSearch API

通过 FastAPI 启动服务器:

python -m mindsearch.app --lang en --model_format internlm_server --search_engine DuckDuckGoSearch --asy
  • 参数--lang定义模型语言,可以设置为en(英语)或cn(中文)。
  • 参数--model_format定义模型格式,如internlm_server(适用于本地优化的 InternLM2.5-7b-chat)或gpt4
  • 参数--search_engine定义使用的搜索引擎,例如DuckDuckGoSearchBingSearchBraveSearchGoogleSearchTencentSearch

请确保为你选择的搜索引擎设置相应的 API 密钥。

步骤四:设置 MindSearch 前端

MindSearch 提供多种前端接口,包括 React、Gradio 和 Streamlit。

  • React 前端配置:

首先,在 vite.config.ts 文件中配置后端 URL:

HOST="127.0.0.1" PORT=8002 sed -i -r "s/target:\s*\"\"/target: \"${HOST}:${PORT}\"/" frontend/React/vite.config.ts

然后安装 Node.js 和 npm,接着安装项目依赖:

cd frontend/React npm install npm start
  • Gradio 前端启动:
python frontend/mindsearch_gradio.py
  • Streamlit 前端启动:
streamlit run frontend/mindsearch_streamlit.py

变更 Web 搜索 API

用户可以通过修改 mindsearch/agent/__init__.py 中的 searcher_type 属性来更换不同类型的 Web 搜索 API。例如,若想改用 Brave Search API,可以进行如下配置:

BingBrowser( searcher_type='BraveSearch', topk=2, api_key=os.environ.get('BRAVE_API_KEY', 'YOUR BRAVE API') )

不使用前端的情况下操作后端

对于更倾向于直接与后端交互的用户,可以使用 backend_example.py 脚本来演示如何发送查询到后端并处理返回结果:

python backend_example.py

确保在执行脚本之前已设置好环境变量并运行后端。

本地调试

使用下面的命令在本地终端进行调试:

python -m mindsearch.terminal

许可证

该项目以 Apache 2.0 许可证 发布。

引用

如果在研究中发现该项目有用,请考虑引用:

@article{chen2024mindsearch,
  title={MindSearch: Mimicking Human Minds Elicits Deep AI Searcher},
  author={Chen, Zehui and Liu, Kuikun and Wang, Qiuchen and Liu, Jiangning and Zhang, Wenwei and Chen, Kai and Zhao, Feng},
  journal={arXiv preprint arXiv:2407.20183},
  year={2024}
}

我们的其他项目

进一步探索我们在大型语言模型上的研究,项目包括:

  • Lagent:用于构建基于 LLM 的代理的轻量级框架。
  • AgentFLAN:通过高质量代理数据集进行构建和训练的创新方法。
  • T-Eval:精细的工具使用评估基准。

编辑推荐精选

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

AI助手热门AI工具AI创作AI辅助写作讯飞绘文内容运营个性化文章多平台分发
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
商汤小浣熊

商汤小浣熊

最强AI数据分析助手

小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。

imini AI

imini AI

像人一样思考的AI智能体

imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。

Keevx

Keevx

AI数字人视频创作平台

Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。

即梦AI

即梦AI

一站式AI创作平台

提供 AI 驱动的图片、视频生成及数字人等功能,助力创意创作

下拉加载更多