探索LLaMA和RWKV大型语言模型的ONNX格式实现,包括模型导出、量化和推理优化等关键技术,助力在各类设备上高效部署LLM。
深入解读 Awesome-Language-Agents 项目,探讨基于大型语言模型的智能代理发展现状、应用前景及未来挑战,为人工智能研究者和开发者提供全面的语言智能代理资源汇总。
PaddleNLP是基于飞桨深度学习框架的自然语言处理开发库,具有易用的文本领域API、多场景应用示例和高性能分布式训练三大特点,致力于提升开发者在NLP领域的开发效率,支持从学术到产业级的NLP应用开发。
RAG-Retrieval 提供了统 一的 RAG 检索微调和推理框架,支持多种检索模型,并开发了轻量级 Python 库实现高效推理,为 RAG 应用提供全面解决方案。
LMDeploy是一个用于压缩、部署和服务大语言模型(LLM)的工具包,由MMRazor和MMDeploy团队开发。它具有高效推理、有效量化、简单分布式服务、交互式推理模式和出色兼容性等核心特性。
ONNX作为一个开放的AI生态系统,为AI开发者提供了灵活选择工具的能力,实现了深度学习和传统机器学习模型的互操作性,推动了AI创新的加速发展。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号