<a href="https://qanything.ai"><img src="https://img.shields.io/badge/在线试用-qanything.ai-purple"></a> <a href="https://read.youdao.com#/home"><img src="https://img.shields.io/badge/在线试用-read.youdao.com-purple"></a>
<a href="./LICENSE"><img src="https://img.shields.io/badge/许可证-Apache--2.0-yellow"></a> <a href="https://github.com/netease-youdao/QAnything/pulls"><img src="https://img.shields.io/badge/欢迎-PR-red"></a> <a href="https://twitter.com/YDopensource"><img src="https://img.shields.io/badge/关注-%40YDOpenSource-1DA1F2?logo=twitter&style={style}"></a>
<a href="https://discord.gg/5uNpPsEJz8"><img src="https://img.shields.io/discord/1197874288963895436?style=social&logo=discord"></a>
</div> <details open="open"> <summary>目录</summary> </details>QAnything
(基于任何内容的问答)是一个本地知识库问答系统,设计用于支持广泛的文件格式和数据库,允许离线安装和使用。
使用QAnything
,您可以简单地放入任何本地存储的任意格式文件,并获得准确、快速和可靠的答案。
目前支持的格式包括:PDF(pdf)、Word(docx)、PPT(pptx)、XLS(xlsx)、Markdown(md)、电子邮件(eml)、TXT(txt)、图像(jpg,jpeg,png)、CSV(csv)、网页链接(html),更多格式即将推出...
在知识库数据量大的场景下,两阶段方法的优势非常明显。如果只使用第一阶段的嵌入检索,随着数据量的增加会出现检索退化的问题,如下图绿线所示。但是经过第二阶段的重排序后,可以稳定提升准确率,数据越多,效果越好。
<div align="center"> <img src="https://yellow-cdn.veclightyear.com/835a84d5/aafe616d-d946-45d6-b477-151c60fbbf8b.jpg" width = "500" alt="two stage retrievaal" align=center /> </div>QAnything使用检索组件BCEmbedding,它以双语和跨语言能力著称。BCEmbedding在弥合中英文语言差距方面表现出色,实现了
模型 | 检索 | STS | 对分类 | 分类 | 重排 | 聚类 | 平均 |
---|---|---|---|---|---|---|---|
bge-base-en-v1.5 | 37.14 | 55.06 | 75.45 | 59.73 | 43.05 | 37.74 | 47.20 |
bge-base-zh-v1.5 | 47.60 | 63.72 | 77.40 | 63.38 | 54.85 | 32.56 | 53.60 |
bge-large-en-v1.5 | 37.15 | 54.09 | 75.00 | 59.24 | 42.68 | 37.32 | 46.82 |
bge-large-zh-v1.5 | 47.54 | 64.73 | 79.14 | 64.19 | 55.88 | 33.26 | 54.21 |
jina-embeddings-v2-base-en | 31.58 | 54.28 | 74.84 | 58.42 | 41.16 | 34.67 | 44.29 |
m3e-base | 46.29 | 63.93 | 71.84 | 64.08 | 52.38 | 37.84 | 53.54 |
m3e-large | 34.85 | 59.74 | 67.69 | 60.07 | 48.99 | 31.62 | 46.78 |
bce-embedding-base_v1 | 57.60 | 65.73 | 74.96 | 69.00 | 57.29 | 38.95 | 59.43 |
模型 | 重排 | 平均 |
---|---|---|
bge-reranker-base | 57.78 | 57.78 |
bge-reranker-large | 59.69 | 59.69 |
bce-reranker-base_v1 | 60.06 | 60.06 |
注意:
无重排
设置下,我们的bce-embedding-base_v1
优于所有其他嵌入模型。bce-reranker-base_v1
取得了最佳性能。bce-embedding-base_v1
和bce-reranker-base_v1
的组合达到了最先进水平。QAnything的开源版本基于QwenLM,并在大量专业问答数据集上进行了微调。它极大地增强了问答能力。 如果您需要将其用于商业目的,请遵循QwenLM的许可。更多详情,请参考:QwenLM
在GitHub上为我们点星,立即获得新版本通知!
我们提供两个版本: Python版本和Docker版本 Python版本适合快速体验新功能,而Docker版本适合二次开发和在实际生产环境中使用,暂时不支持新功能。
不同安装方法对应的功能如下:
功能 | Python版本 | Docker版本 | 说明 |
---|---|---|---|
详细安装文档 | ✅ 详情 | ✅ 详情 | |
支持API | ✅ 详情 | ✅ 详情 | |
支持生产环境 | ❌ | ✅ | |
支持离线安装(私有化部署) | ❌ | ✅ 详情 | |
支持多并发 | ❌ | ✅ 详情 | Python版本使用API而非本地大模型时,可手动设置。详情 |
支持多卡推理 | ❌ | ✅ 详情 | |
支持Mac(M系列芯片) | ✅ | ❌ | 目前在Mac上运行本地LLM依赖llamacpp,问答速度较慢。建议使用OpenAI API调用模型服务。 |
支持Linux | ✅ | ✅ | Python版本在Linux下默认使用onnxruntime-gpu,glibc<2.28时自动切换为onnxruntime。 |
支持windows WSL | ✅ | ✅ | |
支持仅CPU | ✅ 详情 | ❌ | |
支持混合搜索(BM25+embedding) | ❌ | ✅ | |
支持网页搜索(需要VPN) | ✅ 详情 | ❌ | Docker版本计划中。 |
支持FAQ | ✅ 详情 | ❌ | Docker版本计划中。 |
支持BOT | ✅ 详情 | ❌ | Docker版本计划中。 |
支持溯源 | ✅ 详情 | ❌ | Docker版本计划中。 |
支持通过API查询日志 | ✅ 详情 | ❌ | Docker版本计划中。 |
支持音频文件 | ✅ | ❌ | Docker版本计划中,上传文件将支持mp3和wav格式文件。 |
支持OpenCloudOS | ✅ 详情 | ❌ | |
支持与Openaiapi兼容的接口(包括ollama) | ✅ 详情 | ✅ 详情 | 需要手动设置api_key、base_url、model等参数。 |
PDF解析性能提升(包括表格) | ✅ 详情 | ❌ | |
用户自定义配置(实验性:提高速度) | ✅ 详情 | ❌ | |
其他文件类型解析性能提升 | ❌ | ❌ | 预计15天后发布下一版本。 |
如果您不想使用Docker进行安装,我们提供了纯Python安装指南。纯Python环境的安装仅用于演示目的,不建议在生产环境中部署。
系统 | 所需项目 | 最低要求 | 注意 |
---|---|---|---|
Linux | NVIDIA GPU内存 | >= 4GB(使用OpenAI API) | 最低:GTX 1050Ti(使用OpenAI API)<br> 推荐:RTX 3090 |
NVIDIA驱动版本 | >= 525.105.17 | ||
Docker版本 | >= 20.10.5 | Docker安装 | |
docker compose版本 | >= 2.23.3 | docker compose安装 | |
git-lfs | git-lfs安装 |
系统 | 所需项目 | 最低要求 | 注意 |
---|---|---|---|
Windows WSL Ubuntu子系统 | NVIDIA GPU内存 | >= 4GB(使用OpenAI API) | 最低:GTX 1050Ti(使用OpenAI API)<br> 推荐:RTX 3090 |
GEFORCE EXPERIENCE | >= 546.33 | GEFORCE EXPERIENCE下载 | |
Docker Desktop | >= 4.26.1(131620) | Windows版Docker Desktop | |
git-lfs | git-lfs安装 |
[object Object],[object Object]
bash ./run.sh -h
获取LLM接口的详细使用说明<details> <summary>(注意)如果自动下载失败,您可以从以下三个地址之一手动下载模型。</summary>[object Object],[object Object],[object Object],[object Object],[object Object]
modelscope:https://modelscope.cn/models/netease-youdao/QAnything
wisemodel:https://wisemodel.cn/models/Netease_Youdao/qanything
huggingface:https://huggingface.co/netease-youdao/QAnything
</details> <details> <summary>(可选)指定GPU启动</summary></details> <details> <summary>(可选)指定GPU启动 - 推荐Windows10/Windows11 WSL2用户使用</summary>[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
</details> <details> <summary>(可选)指定GPU启动 - 推荐GPU计算能力 >= 8.6且VRAM >= 24GB的用户使用</summary>[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
</details> <details> <summary>(可选)指定多GPU启动</summary>[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
</details>[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
安装成功后,您可以通过在网络浏览器中输入以下地址来体验应用。
your_host
:8777/qanything/如果您想访问API,请参考以下地址:
your_host
:8777/api/如果您想查看相关日志,请查看QAnything/logs/debug_logs
目录下的日志文件。
如果您使用的是Windows11系统:需要进入WSL环境。
[object Object],[object Object]
如果您想离线安装QAnything,可以使用以下命令启动服务。
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
如果您需要访问API,请参考QAnything API文档。
我们感谢您对为我们的项目做出贡献的兴趣。无论您是修复错误、改进现有功能,还是添加全新的内容,我们都欢迎您的贡献!
🔎 要了解QAnything的未来计划和进展,请查看:QAnything路线图
🤬要向QAnything提供反馈,请查看:QAnything反馈
欢迎加入QAnything的Discord社区
欢迎关注QAnything微信公众号,获取最新信息。
<img src="https://yellow-cdn.veclightyear.com/835a84d5/4f19ec11-1185-4f8e-8880-a5a63597730c.jpg" width="30%" height="auto">欢迎扫码加入QAnything讨论群。
<img src="https://yellow-cdn.veclightyear.com/835a84d5/0ef171df-94d0-4a26-a1c0-d303a556e96d.jpg" width="30%" height="auto">如果您需要私下联系我们的团队,请通过以下电子邮件与我们联系:
通过以下方式与维护者联系:
QAnything
采用Apache 2.0许可证
QAnything
采用了以下项目的依赖:
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。
字节跳动发布的AI编程神器IDE
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
AI助力,做PPT更简单!
咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。
选题、配图、成文,一站式创作,让内容运营更高效
讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。
专业的AI公文写作平台,公文写作神器
AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。
OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。
openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。
高分辨率纹理 3D 资产生成
Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。
一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。
3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号