MindSearch

MindSearch

开源AI搜索引擎框架,支持深度知识探索

MindSearch是一个开源的AI搜索引擎框架,支持Perplexity.ai Pro性能。用户可以使用GPT、Claude等闭源LLM或InternLM2.5-7b-chat等开源LLM,轻松部署类似Perplexity.ai风格的搜索引擎。MindSearch能够解决各种问题,通过浏览数百个网页提供深入的知识,并优化用户界面体验。它通过动态图构建过程,将用户查询分解为多个子问题,逐步扩展搜索图,显著提高响应的深度、广度和准确性。

MindSearchAI搜索引擎知识发现人类偏好开源框架Github开源项目

MindSearch 项目介绍

项目概述

MindSearch 是一个旨在模拟人类思维的深度 AI 搜索器,其目标是通过高级人工智能技术改进搜索体验。该项目不仅提高了搜索能力,还通过创新机制使用户的搜索更加高效和人性化。

项目进展

在 2024 年 11 月 5 日,MindSearch 已经在 Puyu 平台上线,用户可以通过 这个链接 进行体验。此次更新主要包括重构了基于 Lagent v0.5 的代理模块,这使得系统在并发情况下的性能得到了提升。此外,用户界面也进行了改进,支持同时进行多个查询的搜索。

如何构建 MindSearch

步骤一:安装依赖

首先,需要从 GitHub 仓库克隆 MindSearch 项目,并安装所需的 Python 依赖:

git clone https://github.com/InternLM/MindSearch cd MindSearch pip install -r requirements.txt

步骤二:设置环境变量

在设置 API 之前,需要配置环境变量。将.env.example文件重命名为.env,并填写必要的参数。

mv .env.example .env

步骤三:设置 MindSearch API

通过 FastAPI 启动服务器:

python -m mindsearch.app --lang en --model_format internlm_server --search_engine DuckDuckGoSearch --asy
  • 参数--lang定义模型语言,可以设置为en(英语)或cn(中文)。
  • 参数--model_format定义模型格式,如internlm_server(适用于本地优化的 InternLM2.5-7b-chat)或gpt4
  • 参数--search_engine定义使用的搜索引擎,例如DuckDuckGoSearchBingSearchBraveSearchGoogleSearchTencentSearch

请确保为你选择的搜索引擎设置相应的 API 密钥。

步骤四:设置 MindSearch 前端

MindSearch 提供多种前端接口,包括 React、Gradio 和 Streamlit。

  • React 前端配置:

首先,在 vite.config.ts 文件中配置后端 URL:

HOST="127.0.0.1" PORT=8002 sed -i -r "s/target:\s*\"\"/target: \"${HOST}:${PORT}\"/" frontend/React/vite.config.ts

然后安装 Node.js 和 npm,接着安装项目依赖:

cd frontend/React npm install npm start
  • Gradio 前端启动:
python frontend/mindsearch_gradio.py
  • Streamlit 前端启动:
streamlit run frontend/mindsearch_streamlit.py

变更 Web 搜索 API

用户可以通过修改 mindsearch/agent/__init__.py 中的 searcher_type 属性来更换不同类型的 Web 搜索 API。例如,若想改用 Brave Search API,可以进行如下配置:

BingBrowser( searcher_type='BraveSearch', topk=2, api_key=os.environ.get('BRAVE_API_KEY', 'YOUR BRAVE API') )

不使用前端的情况下操作后端

对于更倾向于直接与后端交互的用户,可以使用 backend_example.py 脚本来演示如何发送查询到后端并处理返回结果:

python backend_example.py

确保在执行脚本之前已设置好环境变量并运行后端。

本地调试

使用下面的命令在本地终端进行调试:

python -m mindsearch.terminal

许可证

该项目以 Apache 2.0 许可证 发布。

引用

如果在研究中发现该项目有用,请考虑引用:

@article{chen2024mindsearch,
  title={MindSearch: Mimicking Human Minds Elicits Deep AI Searcher},
  author={Chen, Zehui and Liu, Kuikun and Wang, Qiuchen and Liu, Jiangning and Zhang, Wenwei and Chen, Kai and Zhao, Feng},
  journal={arXiv preprint arXiv:2407.20183},
  year={2024}
}

我们的其他项目

进一步探索我们在大型语言模型上的研究,项目包括:

  • Lagent:用于构建基于 LLM 的代理的轻量级框架。
  • AgentFLAN:通过高质量代理数据集进行构建和训练的创新方法。
  • T-Eval:精细的工具使用评估基准。

编辑推荐精选

Pixmax

Pixmax

一站式AI短剧创作平台

Pixmax专注打造下一代“ AI 视觉创作引擎”,整合行业顶尖 AI 大模型、工工业级精准控制及企业级协同管理功能,是全方位的 AI 内容创作平台。

豆包

豆包

字节跳动旗下 AI 智能助手

字节跳动旗下 AI 智能助手

GPT Plus|Pro充值

GPT Plus|Pro充值

GPT充值

支持 ChatGPT Plus / Pro 充值服务,支付便捷,自动发货,售后可查。

GPT Image 2中文站

GPT Image 2中文站

AI 图片生成平台

GPT Image 2 是面向用户的 AI 图片生成平台,支持文生图、图生图及多模型创意工作流。

Vecbase

Vecbase

你的AI Agent团队

Vecbase 是专为 AI 团队打造的智能工作空间,将数据管理、模型协作与知识沉淀整合于一处。算法、产品与业务在同一平台无缝协同,让从数据到 AI 应用的落地更快一步。

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

下拉加载更多