推理工具大全:AI推理平台、应用和开源项目集合

LLaMA/RWKV ONNX模型:高效推理与量化的开源实现

LLaMA/RWKV ONNX模型:高效推理与量化的开源实现

探索LLaMA和RWKV大型语言模型的ONNX格式实现,包括模型导出、量化和推理优化等关键技术,助力在各类设备上高效部署LLM。

LLaMaRWKVonnx模型量化推理Github开源项目
探索语言智能代理的前沿:Awesome-Language-Agents 项目解析

探索语言智能代理的前沿:Awesome-Language-Agents 项目解析

深入解读 Awesome-Language-Agents 项目,探讨基于大型语言模型的智能代理发展现状、应用前景及未来挑战,为人工智能研究者和开发者提供全面的语言智能代理资源汇总。

CoALA认知架构语言代理推理学习Github开源项目
PaddleNLP: 飞桨强大易用的自然语言处理开发库

PaddleNLP: 飞桨强大易用的自然语言处理开发库

PaddleNLP是基于飞桨深度学习框架的自然语言处理开发库,具有易用的文本领域API、多场景应用示例和高性能分布式训练三大特点,致力于提升开发者在NLP领域的开发效率,支持从学术到产业级的NLP应用开发。

PaddleNLP大模型训练推理飞桨Github开源项目
RAG-Retrieval: 革新检索增强生成的全链路解决方案

RAG-Retrieval: 革新检索增强生成的全链路解决方案

RAG-Retrieval 提供了统一的 RAG 检索微调和推理框架,支持多种检索模型,并开发了轻量级 Python 库实现高效推理,为 RAG 应用提供全面解决方案。

RAG-Retrieval微调推理排序模型检索模型Github开源项目
LMDeploy: 高效的大语言模型压缩、部署与服务工具包

LMDeploy: 高效的大语言模型压缩、部署与服务工具包

LMDeploy是一个用于压缩、部署和服务大语言模型(LLM)的工具包,由MMRazor和MMDeploy团队开发。它具有高效推理、有效量化、简单分布式服务、交互式推理模式和出色兼容性等核心特性。

LMDeploy量化推理多模态模型部署Github开源项目
ONNX: 开放式神经网络交换格式的革命性力量

ONNX: 开放式神经网络交换格式的革命性力量

ONNX作为一个开放的AI生态系统,为AI开发者提供了灵活选择工具的能力,实现了深度学习和传统机器学习模型的互操作性,推动了AI创新的加速发展。

ONNXAI模型深度学习机器学习推理Github开源项目