大语言模型
PhaseLLM是一个开源的大型语言模型(LLM)评估和工作流框架,旨在帮助开发者更轻松地管理、测试和优化基于LLM的产品和体验。
探索阿里巴巴开源的RTP-LLM项目,一个为多样化应用场景设计的高性能大语言模型推理加速引擎。
探讨大型语言模型(LLM)推理能力的最新进展,包括链式思考、指令微调和多模态推理等关键技术,为研究人员和开发者提供全面的资源汇总。
Baichuan2是百川智能推出的新一代开源大语言模型,在多个权威基准测试中取得同尺寸最佳效果。本文详细介绍了Baichuan2的特点、性能表现以及应用方法。
Lagent是一个轻量级开源框架,可以帮助用户高效地构建基于大语言模型的智能代理。它提供了统一的接口、流式输出等功能,并支持多种模型和工具的集成,是开发LLM应用的理想选择。
本文全面综述了大型语言模型(LLM)智能体的最新研究进展,涵盖个性化、记忆、规划等关键能力,以及多智能体系统的发展。文章深入探讨了LLM智能体在各个方面的创新与挑战,为读者提供了该领域的全面认识。
LISA是一个创新的图像分割模型,它结合了多模态大语言模型的语言生成能力和图像分割能力,可以处理复杂推理、世界知识、解释性回答和多轮对话等任务。本文详细介绍了LISA的原理、特点、训练方法和应用场景。
本文全面介绍了LLMDataHub项目,这是一个收集和整理用于训练大型语言模型的高质量数据集的开源项目。文章详细阐述了项目的目标、主要数据集类型、重要数据集的特点,以及如何利用这些资源来改进语言模型的能力。
PowerInfer是一个创新的大语言模型推理引擎,能够在配备单个消费级GPU的个人电脑上实现高速推理。它通过利用LLM推理中的高局部性,设计了GPU-CPU混合推理引擎,显著提高了推理速度,同时保持了模型精度。
本文深入探讨了LLM-Agent-Paper-List项目,全面梳理了大语言模型驱动的智能体研究领域的最新进展,包括智能体的构建、应用场景以及社会影响等多个方面,为读者提供了该领域的系统性概览。
本文深入探讨了Awesome-Chinese-LLM项目,全面介绍了中文大语言模型的发展现状、主要模型、应用领域以及相关资源,为读者提供了一个全面了解中文LLM生态的窗口。
WebLLM是一个高性能的浏览器内大语言模型推理引擎,利用WebGPU实现硬件加速,使强大的LLM操作可以直接在Web浏览器中进行,无需服务器端处理。
GPTCache是一个开源的语义缓存框架,可以显著提高大型语言模型应用的性能和效率,同时降低API调用成本。
本文深入探讨了Azure OpenAI服务和大型语言模型(LLM)的应用,重点介绍了检索增强生成(RAG)、LlamaIndex框架以及向量存储技术,为读者提供了全面的LLM应用开发指南。