最佳LLM工具集合:高效AI解决方案推荐

flute

flute

FLUTE量化

专为LUT量化大语言模型开发的灵活查找表引擎

Awesome-LLM-Prompt-Optimization

Awesome-LLM-Prompt-Optimization

LLM提示优化

大型语言模型提示词优化技术与研究前沿总览

awesome-llm-interpretability

awesome-llm-interpretability

LLM可解释性

深入理解大语言模型内部机制与可解释性

paper-qa

paper-qa

PaperQA文献问答

基于文档的智能问答系统 实现精准信息检索和回答生成

doppel-bot

doppel-bot

DoppelBotSlack

AI聊天机器人模仿用户回复风格

LLM-Workshop

LLM-Workshop

LLM人工智能

大语言模型实践与应用工作坊

LLM-Reading-List

LLM-Reading-List

LLMTransformer

大语言模型技术与优化方法的综合阅读列表

neurips_llm_efficiency_challenge

neurips_llm_efficiency_challenge

NeurIPSLLM

NeurIPS单GPU大语言模型效率优化挑战赛

prompt-lookup-decoding

prompt-lookup-decoding

Prompt Lookup Decoding推测解码

提升输入相关任务解码效率的创新技术

wren-engine

wren-engine

Wren Engine语义引擎

专为大型语言模型(LLM)设计的语义引擎

Eurus

Eurus

EurusLLM

专注推理能力的开源大语言模型套件

Awesome-LLM-Uncertainty-Reliability-Robustness

Awesome-LLM-Uncertainty-Reliability-Robustness

LLM不确定性

大语言模型的不确定性、可靠性和鲁棒性研究资源集

Gentopia

Gentopia

GentopiaAI代理

轻量级智能体研究框架支持专业化和共享

gmail-extractor

gmail-extractor

LLMPython

Gmail邮件中旅行信息的自动提取与分析

ai-engineer-workshop

ai-engineer-workshop

RAGLLM

构建评估和优化生产级RAG应用的实践指南

tarsier

tarsier

Tarsier网页交互

网页交互感知系统赋能AI代理执行网络任务

llm-awq

llm-awq

AWQLLM

激活感知权重量化技术实现大语言模型高效压缩与加速

KIVI

KIVI

KIVIKV缓存量化

高效2比特KV缓存量化算法提升大型语言模型性能

Platypus

Platypus

PlatypusLLM

高效经济的大语言模型微调开源项目

chat_templates

chat_templates

chat templatesLLM

标准化大语言模型聊天模板的开源库