awesome-local-ai

awesome-local-ai

全面收录开源本地AI工具和解决方案

awesome-local-ai收录了多种开源本地AI工具和解决方案,包括推理引擎、用户界面、完整平台、开发工具、用户工具和AI代理等。项目旨在为开发者和用户提供丰富的本地AI资源,便于探索和应用最新AI技术,同时确保数据隐私。此外,还涵盖了LLM排行榜和相关研究论文,为AI领域从业者和爱好者提供全面参考。

本地AI开源工具大语言模型推理引擎AI应用Github开源项目

超棒的本地AI 推文

如果你尝试过Jan桌面版并且喜欢它,请也查看以下开源和/或本地AI工具和解决方案的精彩集合。

欢迎您随时贡献!

列表

推理引擎

仓库描述支持的模型格式CPU/GPU支持UI语言平台类型
llama.cpp- 纯C/C++的LLaMA模型推理GGML/GGUF两者C/C++文本生成
Nitro- 3MB推理引擎,可嵌入您的应用。使用Llamacpp等两者两者文本生成
ollama- CLI和本地服务器。使用Llamacpp两者两者文本生成
koboldcpp- 使用KoboldAI的UI运行各种GGML模型的简单单文件方式GGML两者C/C++文本生成
LoLLMS- 大型语言模型之王Web用户界面。几乎所有两者Python文本生成
ExLlama- HF transformers的Llama实现的更节省内存的重写版本AutoGPTQ/GPTQGPUPython/C++文本生成
vLLM- vLLM是一个快速且易用的LLM推理和服务库。GGML/GGUF两者Python文本生成
SGLang- 比vLLM高3-5倍的吞吐量(控制流、RadixAttention、KV缓存重用)Safetensor / AWQ / GPTQGPUPython文本生成
LmDeploy- LMDeploy是一个用于压缩、部署和服务LLM的工具包。Pytorch / Turbomind两者Python/C++文本生成
Tensorrt-llm- 在NVIDIA GPU上高效推理Python / C++ 运行时两者Python/C++文本生成
CTransformers- 使用GGML库在C/C++中实现的Transformer模型的Python绑定GGML/GPTQ两者C/C++文本生成
llama-cpp-python- llama.cpp的Python绑定GGUF两者Python文本生成
llama2.rs- 纯Rust实现的快速llama2解码器GPTQCPURust文本生成
ExLlamaV2- 一个快速推理库,用于在现代消费级GPU上本地运行LLMGPTQ/EXL2GPUPython/C++文本生成
LoRAX- 可扩展到1000多个微调LLM的多LoRA推理服务器Safetensor / AWQ / GPTQGPUPython/Rust文本生成
text-generation-inference- 推理服务工具箱,为每种LLM架构提供优化的内核Safetensors / AWQ / GPTQ两者Python/Rust文本生成

推理UI

  • oobabooga - 一个用于大型语言模型的Gradio网页界面。
  • LM Studio - 发现、下载和运行本地大语言模型。
  • LocalAI - LocalAI是一个即插即用的REST API替代品,兼容OpenAI API规范,用于本地推理。
  • FireworksAI - 体验世界上最快的LLM推理平台,无需额外费用即可部署您自己的模型。
  • faradav - 离线与AI角色聊天,本地运行,零配置。
  • GPT4All - 一个免费使用、本地运行、注重隐私的聊天机器人。
  • LLMFarm - 使用GGML库在iOS和MacOS上离线运行llama和其他大型语言模型。
  • LlamaChat - LlamaChat允许您在Mac上本地运行LLaMa、Alpaca和GPT4All模型进行聊天。
  • LLM as a Chatbot Service - 将LLM作为聊天机器人服务。
  • FuLLMetalAi - Fullmetal.Ai是一个分布式的自托管大型语言模型(LLMs)网络。
  • Automatic1111 - Stable Diffusion网页界面。
  • ComfyUI - 一个功能强大且模块化的Stable Diffusion图形用户界面,具有图形/节点界面。
  • Wordflow - 在浏览器中运行、分享和发现AI提示。
  • petals - 像BitTorrent一样在家运行LLMs。微调和推理速度比卸载快10倍。
  • ChatUI - 为HuggingChat应用提供支持的开源代码库。
  • AI-Mask - 为网页应用提供模型推理的浏览器扩展。由web-llm和transformers.js支持。
  • everything-rag - 通过易于使用的、100%本地的Gradio聊天机器人与Hugging Face Hub上的(几乎)任何LLM进行交互。
  • LmScript - SGLang和Outlines的用户界面

平台/完整解决方案

  • H2OAI - H2OGPT 最快、最准确的AI云平台。
  • BentoML - BentoML是一个用于构建可靠、可扩展和高效的AI应用程序的框架。
  • Predibase - LLMs的无服务器LoRA微调和服务。

开发者工具

  • Jan Framework - Jan的核心是一个跨平台、本地优先和AI原生的应用框架,可用于构建任何东西。
  • Pinecone - AI的长期记忆。
  • PoplarML - PoplarML使用最少的工程努力即可部署生产就绪、可扩展的ML系统。
  • Datature - 构建和部署视觉AI的一站式平台。
  • One AI - 让生成式AI适用于商业。
  • Gooey.AI - 创建您自己的无代码AI工作流程。
  • Mixo.io - AI网站构建器。
  • Safurai - AI代码助手,帮助您节省修改、优化和搜索代码的时间。
  • GitFluence - 一个AI驱动的解决方案,帮助您快速找到正确的命令。立即开始使用Git命令生成器,节省时间。
  • Haystack - 一个用于构建NLP应用程序(如代理、语义搜索、问答)的框架,使用语言模型。
  • LangChain - 一个用于开发由语言模型驱动的应用程序的框架。
  • gpt4all - 一个在大量干净的助手数据(包括代码、故事和对话)上训练的聊天机器人。
  • LMQL - LMQL是一种针对大型语言模型的查询语言。
  • LlamaIndex - 一个数据框架,用于构建基于外部数据的LLM应用程序。
  • Phoenix - 由Arize开发的开源ML可观察性工具,在您的笔记本环境中运行。监控和微调LLM、CV和表格模型。
  • trypromptly - 在几分钟内创建AI应用和聊天机器人。
  • BentoML - BentoML是软件工程师构建AI产品的平台。
  • LiteLLM - 使用OpenAI格式调用所有LLM API。

用户工具

  • llmcord.py - Discord LLM聊天机器人 - 与您的朋友一起与LLMs交谈!

代理

  • SuperAGI - 开源AGI基础设施。
  • Auto-GPT - 一个试图让GPT-4完全自主的开源实验性尝试。
  • BabyAGI - Baby AGI是一个使用Python开发的自主AI代理,通过OpenAI和Pinecone API运行。
  • AgentGPT - 在浏览器中组装、配置和部署自主AI代理。
  • HyperWrite - HyperWrite帮助你更智能、更快速、更轻松地工作。
  • AI Agents - 提升你生产力的AI代理。
  • AgentRunner.ai - 利用GPT-4的力量创建和训练完全自主的AI代理。
  • GPT Engineer - 指定你想要构建的内容,AI会询问澄清,然后构建它。
  • GPT Prompt Engineer - 自动化提示工程。它生成、测试和排序提示以找到最佳提示。
  • MetaGPT - 多代理框架:给出一行需求,返回PRD、设计、任务、代码库。
  • Open Interpreter - 让语言模型运行代码。让你的代理编写和执行代码。
  • CrewAI - 用于编排角色扮演、自主AI代理的前沿框架。

训练

  • FastChat - 用于训练、服务和评估大型语言模型的开放平台。
  • DeepSpeed - DeepSpeed是一个深度学习优化库,使分布式训练和推理变得简单、高效和有效。
  • BMTrain - 大型模型的高效训练。
  • Alpa - Alpa是一个用于训练和服务大规模神经网络的系统。
  • Megatron-LM - 正在进行的大规模训练transformer模型的研究。
  • Ludwig - 用于构建自定义LLM、神经网络和其他AI模型的低代码框架。
  • Nanotron - 极简的大型语言模型3D并行训练。
  • TRL - 使用强化学习进行语言模型对齐。
  • PEFT - 参数高效微调(LoRA、DoRA、模型合并等)

LLM排行榜

研究

  • 注意力就是一切(2017):介绍了原始的transformer模型。它有助于序列到序列的任务,如机器翻译。[论文]
  • BERT:用于语言理解的深度双向Transformers预训练(2018):有助于语言建模和预测任务。[论文]
  • FlashAttention:具有IO感知的快速且内存高效的精确注意力机制(2022):改进transformer的机制。[论文]
  • 通过生成式预训练提高语言理解(2019):OpenAI关于GPT的论文。[论文]
  • Cramming:在一天内用单个GPU训练语言模型(2022):论文专注于一种使用最少计算能力提高性能的方法。[论文]
  • LaMDA:对话应用的语言模型(2022):LaMDA是谷歌基于Transformer的神经语言模型系列。[论文]
  • 通过人类反馈训练语言模型遵循指令(2022):使用人类反馈来对齐LLM。[论文]
  • TurboTransformers:Transformer模型的高效GPU服务系统(PPoPP'21) [论文]
  • 大型语言模型的快速分布式推理服务(arXiv'23) [论文]
  • 基于CPU的Transformer语言模型的高效稀疏推理软件加速器(arXiv'23) [论文]
  • 使用分阶段推测解码加速LLM推理(arXiv'23) [论文]
  • ZeRO:面向训练万亿参数模型的内存优化(SC'20) [论文]
  • TensorGPT:基于张量列分解的LLM嵌入层高效压缩 2023 [论文]

社区

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多