大语言模型:精选AI工具、网站与开源项目

大语言模型

PhaseLLM:大型语言模型评估与工作流框架

PhaseLLM:大型语言模型评估与工作流框架

PhaseLLM是一个开源的大型语言模型(LLM)评估和工作流框架,旨在帮助开发者更轻松地管理、测试和优化基于LLM的产品和体验。

PhaseLLM大语言模型性能评估API集成开源Github开源项目
RTP-LLM: 阿里巴巴的高性能大语言模型推理引擎

RTP-LLM: 阿里巴巴的高性能大语言模型推理引擎

探索阿里巴巴开源的RTP-LLM项目,一个为多样化应用场景设计的高性能大语言模型推理加速引擎。

rtp-llm大语言模型CUDA量化多模态输入Github开源项目
Awesome-LLM-Reasoning: 大型语言模型推理能力的前沿探索

Awesome-LLM-Reasoning: 大型语言模型推理能力的前沿探索

探讨大型语言模型(LLM)推理能力的最新进展,包括链式思考、指令微调和多模态推理等关键技术,为研究人员和开发者提供全面的资源汇总。

大语言模型推理能力技术进展Awesome LLM Reasoning多模态推理Github开源项目
Baichuan2: 开源大语言模型的新突破

Baichuan2: 开源大语言模型的新突破

Baichuan2是百川智能推出的新一代开源大语言模型,在多个权威基准测试中取得同尺寸最佳效果。本文详细介绍了Baichuan2的特点、性能表现以及应用方法。

Baichuan 2大语言模型开源模型微调推理和部署Github开源项目
Lagent:构建基于大语言模型的智能代理的轻量级开源框架

Lagent:构建基于大语言模型的智能代理的轻量级开源框架

Lagent是一个轻量级开源框架,可以帮助用户高效地构建基于大语言模型的智能代理。它提供了统一的接口、流式输出等功能,并支持多种模型和工具的集成,是开发LLM应用的理想选择。

Lagent大语言模型开源智能代理流式输出Github开源项目
LLM智能体的进展与挑战:从个性化到多智能体协作

LLM智能体的进展与挑战:从个性化到多智能体协作

本文全面综述了大型语言模型(LLM)智能体的最新研究进展,涵盖个性化、记忆、规划等关键能力,以及多智能体系统的发展。文章深入探讨了LLM智能体在各个方面的创新与挑战,为读者提供了该领域的全面认识。

LLM Agents Papers大语言模型知识编辑智能代理Prompt4ReasoningPapersGithub开源项目
LISA: 基于大语言模型的推理分割助手

LISA: 基于大语言模型的推理分割助手

LISA是一个创新的图像分割模型,它结合了多模态大语言模型的语言生成能力和图像分割能力,可以处理复杂推理、世界知识、解释性回答和多轮对话等任务。本文详细介绍了LISA的原理、特点、训练方法和应用场景。

LISA分割掩码大语言模型推理分割多模态Github开源项目
LLMDataHub: 大型语言模型训练数据集的综合指南

LLMDataHub: 大型语言模型训练数据集的综合指南

本文全面介绍了LLMDataHub项目,这是一个收集和整理用于训练大型语言模型的高质量数据集的开源项目。文章详细阐述了项目的目标、主要数据集类型、重要数据集的特点,以及如何利用这些资源来改进语言模型的能力。

LLMDataHub数据集大语言模型开源社区聊天机器人Github开源项目
PowerInfer: 消费级GPU上的高速大语言模型推理引擎

PowerInfer: 消费级GPU上的高速大语言模型推理引擎

PowerInfer是一个创新的大语言模型推理引擎,能够在配备单个消费级GPU的个人电脑上实现高速推理。它通过利用LLM推理中的高局部性,设计了GPU-CPU混合推理引擎,显著提高了推理速度,同时保持了模型精度。

PowerInfer大语言模型GPU加速混合CPU/GPU使用局部性设计Github开源项目
LLM-Agent-Paper-List: 探索大语言模型驱动的智能体研究前沿

LLM-Agent-Paper-List: 探索大语言模型驱动的智能体研究前沿

本文深入探讨了LLM-Agent-Paper-List项目,全面梳理了大语言模型驱动的智能体研究领域的最新进展,包括智能体的构建、应用场景以及社会影响等多个方面,为读者提供了该领域的系统性概览。

大语言模型人工智能AgentGymR3GitHub TrendingsGithub开源项目
中文大语言模型的发展与应用:探索Awesome-Chinese-LLM项目

中文大语言模型的发展与应用:探索Awesome-Chinese-LLM项目

本文深入探讨了Awesome-Chinese-LLM项目,全面介绍了中文大语言模型的发展现状、主要模型、应用领域以及相关资源,为读者提供了一个全面了解中文LLM生态的窗口。

中文LLM大语言模型开源项目多轮对话可商用Github
WebLLM: 革新浏览器内的大语言模型推理

WebLLM: 革新浏览器内的大语言模型推理

WebLLM是一个高性能的浏览器内大语言模型推理引擎,利用WebGPU实现硬件加速,使强大的LLM操作可以直接在Web浏览器中进行,无需服务器端处理。

WebLLM大语言模型WebGPU浏览器内推理OpenAI API兼容性Github开源项目
GPTCache: 提升LLM应用效率的语义缓存工具

GPTCache: 提升LLM应用效率的语义缓存工具

GPTCache是一个开源的语义缓存框架,可以显著提高大型语言模型应用的性能和效率,同时降低API调用成本。

GPTCache缓存策略大语言模型API成本节约性能提升Github开源项目
Azure OpenAI与大型语言模型:探索RAG、LlamaIndex和向量存储

Azure OpenAI与大型语言模型:探索RAG、LlamaIndex和向量存储

本文深入探讨了Azure OpenAI服务和大型语言模型(LLM)的应用,重点介绍了检索增强生成(RAG)、LlamaIndex框架以及向量存储技术,为读者提供了全面的LLM应用开发指南。

Azure OpenAI大语言模型语言模型训练信息检索API集成Github开源项目
大型语言模型的长文本建模技术:挑战与进��展

大型语言模型的长文本建模技术:挑战与进展

本文全面介绍了大型语言模型在处理长文本时面临的挑战,以及学术界和工业界在提升模型长文本建模能力方面的最新进展和技术方案,包括高效注意力机制、长度外推、长期记忆等多个方向的研究成果。

大语言模型长文本处理信息检索Transformer优化自然语言处理Github开源项目
从零开始构建大语言模型:深入理解LLM原理与实现

从零开始构建大语言模型:深入理解LLM原理与实现

本文详细介绍了如何从头开始实现类似ChatGPT的大语言模型(LLM),包括基础知识、核心架构和实践指南,帮助读者深入理解LLM的工作原理并掌握构建技能。

LLMs From ScratchDatawhale大语言模型深度学习人工智能Github开源项目
AdalFlow: 强大的LLM任务自动优化库

AdalFlow: 强大的LLM任务自动优化库

AdalFlow是一个类似PyTorch的轻量级、模块化和强大的库,用于构建和自动优化各种LLM任务。它提供了统一的自动微分框架,可以实现零样本提示优化和少样本优化。

AdalFlow大语言模型AI库LLM应用模块化Github开源项目
ModelScope-Agent: 构建基于开源大语言模型的可定制智能体系统

ModelScope-Agent: 构建基于开源大语言模型的可定制智能体系统

ModelScope-Agent是一个灵活可扩展的智能体框架,支持使用开源大语言模型构建各种复杂任务的智能助手。本文详细介绍了ModelScope-Agent的核心功能、架构设计和应用案例。

ModelScope-Agent大语言模型代理系统工具调用智能助手Github开源项目
LLM Engine: 开源大语言模型微调和服务引擎

LLM Engine: 开源大语言模型微调和服务引擎

LLM Engine是一个开源的大语言模型微调和服务引擎,提供了简单易用的API来部署、微调和优化大型语言模型。

LLM Engine大语言模型模型微调推理APIScaleGithub开源项目
Awesome-LLM-RAG: 大型语言模型中检索增强生成的最新进展

Awesome-LLM-RAG: 大型语言模型中检索增强生成的最新进展

本文综述了检索增强生成(RAG)技术在大型语言模型中的最新研究进展,涵盖了RAG的基本概念、主要应用场景、关键技术以及未来发展方向,为读者提供了全面的RAG技术概览。

Awesome-LLM-RAGRAGLLM检索增强生成大语言模型Github开源项目