MindSearch

MindSearch

开源AI搜索引擎框架,支持深度知识探索

MindSearch是一个开源的AI搜索引擎框架,支持Perplexity.ai Pro性能。用户可以使用GPT、Claude等闭源LLM或InternLM2.5-7b-chat等开源LLM,轻松部署类似Perplexity.ai风格的搜索引擎。MindSearch能够解决各种问题,通过浏览数百个网页提供深入的知识,并优化用户界面体验。它通过动态图构建过程,将用户查询分解为多个子问题,逐步扩展搜索图,显著提高响应的深度、广度和准确性。

MindSearchAI搜索引擎知识发现人类偏好开源框架Github开源项目

MindSearch 项目介绍

项目概述

MindSearch 是一个旨在模拟人类思维的深度 AI 搜索器,其目标是通过高级人工智能技术改进搜索体验。该项目不仅提高了搜索能力,还通过创新机制使用户的搜索更加高效和人性化。

项目进展

在 2024 年 11 月 5 日,MindSearch 已经在 Puyu 平台上线,用户可以通过 这个链接 进行体验。此次更新主要包括重构了基于 Lagent v0.5 的代理模块,这使得系统在并发情况下的性能得到了提升。此外,用户界面也进行了改进,支持同时进行多个查询的搜索。

如何构建 MindSearch

步骤一:安装依赖

首先,需要从 GitHub 仓库克隆 MindSearch 项目,并安装所需的 Python 依赖:

git clone https://github.com/InternLM/MindSearch cd MindSearch pip install -r requirements.txt

步骤二:设置环境变量

在设置 API 之前,需要配置环境变量。将.env.example文件重命名为.env,并填写必要的参数。

mv .env.example .env

步骤三:设置 MindSearch API

通过 FastAPI 启动服务器:

python -m mindsearch.app --lang en --model_format internlm_server --search_engine DuckDuckGoSearch --asy
  • 参数--lang定义模型语言,可以设置为en(英语)或cn(中文)。
  • 参数--model_format定义模型格式,如internlm_server(适用于本地优化的 InternLM2.5-7b-chat)或gpt4
  • 参数--search_engine定义使用的搜索引擎,例如DuckDuckGoSearchBingSearchBraveSearchGoogleSearchTencentSearch

请确保为你选择的搜索引擎设置相应的 API 密钥。

步骤四:设置 MindSearch 前端

MindSearch 提供多种前端接口,包括 React、Gradio 和 Streamlit。

  • React 前端配置:

首先,在 vite.config.ts 文件中配置后端 URL:

HOST="127.0.0.1" PORT=8002 sed -i -r "s/target:\s*\"\"/target: \"${HOST}:${PORT}\"/" frontend/React/vite.config.ts

然后安装 Node.js 和 npm,接着安装项目依赖:

cd frontend/React npm install npm start
  • Gradio 前端启动:
python frontend/mindsearch_gradio.py
  • Streamlit 前端启动:
streamlit run frontend/mindsearch_streamlit.py

变更 Web 搜索 API

用户可以通过修改 mindsearch/agent/__init__.py 中的 searcher_type 属性来更换不同类型的 Web 搜索 API。例如,若想改用 Brave Search API,可以进行如下配置:

BingBrowser( searcher_type='BraveSearch', topk=2, api_key=os.environ.get('BRAVE_API_KEY', 'YOUR BRAVE API') )

不使用前端的情况下操作后端

对于更倾向于直接与后端交互的用户,可以使用 backend_example.py 脚本来演示如何发送查询到后端并处理返回结果:

python backend_example.py

确保在执行脚本之前已设置好环境变量并运行后端。

本地调试

使用下面的命令在本地终端进行调试:

python -m mindsearch.terminal

许可证

该项目以 Apache 2.0 许可证 发布。

引用

如果在研究中发现该项目有用,请考虑引用:

@article{chen2024mindsearch,
  title={MindSearch: Mimicking Human Minds Elicits Deep AI Searcher},
  author={Chen, Zehui and Liu, Kuikun and Wang, Qiuchen and Liu, Jiangning and Zhang, Wenwei and Chen, Kai and Zhao, Feng},
  journal={arXiv preprint arXiv:2407.20183},
  year={2024}
}

我们的其他项目

进一步探索我们在大型语言模型上的研究,项目包括:

  • Lagent:用于构建基于 LLM 的代理的轻量级框架。
  • AgentFLAN:通过高质量代理数据集进行构建和训练的创新方法。
  • T-Eval:精细的工具使用评估基准。

编辑推荐精选

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

nano-banana纳米香蕉中文站

nano-banana纳米香蕉中文站

国内直接访问,限时3折

输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

堆友

堆友

多风格AI绘画神器

堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

图像生成AI工具AI反应堆AI工具箱AI绘画GOAI艺术字堆友相机AI图像热门
码上飞

码上飞

零代码AI应用开发平台

零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

下拉加载更多