大语言模型:精选AI工具、网站与开源项目

大语言模型

Awesome-LLMOps: 大型语言模型运维的最佳实践与工具

Awesome-LLMOps: 大型语言模型运维的最佳实践与工具

本文深入探讨了LLMOps(大型语言模型运维)的概念、最佳实践和相关工具,为开发者提供了全面的LLMOps指南。从基础概念到具体工具,本文涵盖了LLMOps的方方面面,是一份不可多得的LLMOps学习资料。

LLMOps大语言模型模型部署AI框架模型推理Github开源项目
Motif: 人工智能反馈驱动的内在动机

Motif: 人工智能反馈驱动的内在动机

Motif是一个创新的强化学习框架,利用大语言模型的反馈来生成智能体的内在奖励函数,从而实现更加灵活和可解释的智能体行为。本文将详细介绍Motif的工作原理、主要特点及其在NetHack游戏中的应用成果。

MotifAI强化学习NetHack大语言模型Github开源项目
Awesome-LLM:探索大语言模型的前沿与应用

Awesome-LLM:探索大语言模型的前沿与应用

本文全面介绍了大语言模型(LLM)的发展历程、最新进展和实践应用。从里程碑论文到开源模型,从训练框架到部署工具,为读者呈现了LLM领域的全景图,助力深入理解和应用这一改变世界的AI技术。

大语言模型ChatGPT人工智能自然语言处理深度学习Github开源项目
EfficientQAT: 大语言模型高效量化感知训练的革新技术

EfficientQAT: 大语言模型高效量化感知训练的革新技术

EfficientQAT是一种新型的大语言模型量化技术,通过两阶段训练实现高效压缩,在保持性能的同时大幅减少模型存储需求。本文深入介绍EfficientQAT的原理、优势及其在各类大语言模型上的应用效果。

EfficientQAT大语言模型量化训练模型压缩PyTorchGithub开源项目
DriveMLM: 多模态大语言模型与自动驾驶行为规划的对齐

DriveMLM: 多模态大语言模型与自动驾驶行为规划的对齐

DriveMLM是一个基于大语言模型的自动驾驶框架,能够在真实模拟器中实现闭环自动驾驶。该框架通过标准化决策状态、利用多模态大语言模型进行行为规划、设计有效的数据引擎等创新方法,成功实现了语言决策与车辆控制的对接,为自动驾驶领域的大语言模型应用开辟了新的方向。

DriveMLM自动驾驶大语言模型行为规划多模态Github开源项目
ControlLLM: 让大语言模型具备多模态工具使用能力的创新框架

ControlLLM: 让大语言模型具备多模态工具使用能力的创新框架

ControlLLM是一个创新的框架,通过图搜索方法赋予大语言模型使用多模态工具的能力,可以解决复杂的现实世界任务。本文详细介绍了ControlLLM的工作原理、主要特性和应用场景,展示了其在图像、音频、视频等多模态任务中的优越性能。

ControlLLM大语言模型多模态工具图搜索任务分解Github开源项目
VTimeLLM: 赋予大语言模型把握视频时刻的能力

VTimeLLM: 赋予大语言模型把握视频时刻的能力

VTimeLLM是一个创新的视频大语言模型,专为细粒度视频时刻理解和推理而设计。它采用了边界感知的三阶段训练策略,显著提升了视频理解和推理能力,在多项视频相关任务中大幅超越现有模型。

VTimeLLM视频理解大语言模型时间边界感知多阶段训练Github开源项目
FuseAI: 大型语言模型的知识融合技术探索

FuseAI: 大型语言模型的知识融合技术探索

FuseAI项目致力于通过知识融合技术提升大型语言模型的性能。本文介绍了FuseAI的最新进展,包括FuseLLM和FuseChat两个子项目,探讨了知识融合技术在提升模型能力方面的潜力和应用。

FuseLLM大语言模型知识融合FuseChat开源模型Github开源项目
RWKV_Pytorch: 纯PyTorch实现的RWKV大语言模型推理框架

RWKV_Pytorch: 纯PyTorch实现的RWKV大语言模型推理框架

一个用原生PyTorch实现的RWKV大语言模型推理框架,支持批量推理、并行推理等特性,代码简洁易读易扩展,让我们一起加入灵活的PyTorch生态,共同开源RWKV!

RWKVPyTorch大语言模型推理框架开源Github开源项目
FinRobot: 革新金融应用的人工智能代理平台

FinRobot: 革新金融应用的人工智能代理平台

FinRobot是一个开源的人工智能代理平台,专为金融应用而设计。它整合了多种AI技术,包括大型语言模型,为金融行业提供了全面的解决方案。本文深入探讨了FinRobot的架构、功能和应用前景。

FinRobotAI Agent金融应用大语言模型LLMGithub开源项目
Levanter: 开源高性能大规模语言模型训练框架

Levanter: 开源高性能大规模语言模型训练框架

Levanter是由斯坦福大学CRFM研究中心开发的开源大语言模型训练框架,致力于实现可读性强、可扩展和可重现的基础模型训练。本文深入介绍了Levanter的主要特性、使用方法及其在大规模语言模型训练中的应用。

Levanter大语言模型机器学习框架分布式训练JAXGithub开源项目
OpenFedLLM: 联邦学习助力大语言模型在分散私有数据上的训练

OpenFedLLM: 联邦学习助力大语言模型在分散私有数据上的训练

OpenFedLLM是一个开源的研究代码库,旨在通过联邦学习的方式在分散的私有数据上训练大语言模型,为解决数据隐私和合规性问题提供了新的思路。

联邦学习大语言模型OpenFedLLM开源模型训练Github开源项目
Haystack Cookbook: 使用深度学习和NLP打造强大的问答系统

Haystack Cookbook: 使用深度学习和NLP打造强大的问答系统

Haystack Cookbook是一个包含各种示例笔记本的集合,展示了如何利用Haystack框架构建先进的问答和检索系统。本文将详细介绍Haystack Cookbook的主要特性、使用方法和示例,帮助开发者快速上手这个强大的NLP工具。

HaystackRAG自然语言处理大语言模型向量数据库Github开源项目
大型语言模型的效率优化:一项全面调查

大型语言模型的效率优化:一项全面调查

本文对大型语言模型(LLMs)效率优化的最新研究进行了全面综述,涵盖了模型中心、数据中心和框架中心三个主要方面的优化技术。文章系统地梳理了现有文献,分析了LLMs效率优化的关键挑战和解决方案,为研究人员和实践者提供了宝贵的参考资源。

大语言模型模型压缩量化高效训练高效推理Github开源项目
LLM Zoomcamp: 免费在线课程打造问答系统的全流程

LLM Zoomcamp: 免费在线课程打造问答系统的全流程

DataTalksClub推出的LLM Zoomcamp课程,通过10周的学习,教你如何利用大型语言模型构建智能问答系统,从基础理论到实战项目全面覆盖。

LLM ZoomcampAI系统问答系统在线课程大语言模型Github开源项目
text-generation-webui: 一个功能强大的大语言模型Web UI

text-generation-webui: 一个功能强大的大语言模型Web UI

text-generation-webui是一个基于Gradio的大语言模型Web UI,旨在成为文本生成领域的'AUTOMATIC1111/stable-diffusion-webui'。它支持多种后端,提供丰富的功能,并且易于安装使用。

Text generation web UI大语言模型AI对话开源项目自然语言处理Github
EvalScope: 一个简化高效的大型模型评估与性能基准测试框架

EvalScope: 一个简化高效的大型模型评估与性能基准测试框架

EvalScope是由ModelScope团队开发的开源框架,旨在为大型模型(包括大型语言模型和多模态大型语言模型)提供全面、客观的评估。它集成了多种评估数据集、评估指标和自动化评估工具,支持多种评估模式,并可生成可视化报告,是研究人员和开发者进行模型评估的有力工具。

EvalScope大语言模型评估框架模型集成可视化Github开源项目
EasyJailbreak: 一个用于生成对抗性越狱提示�的统一框架

EasyJailbreak: 一个用于生成对抗性越狱提示的统一框架

EasyJailbreak是一个易于使用的Python框架,旨在通过组装不同的方法生成对抗性越狱提示。本文将深入探讨EasyJailbreak的设计理念、核心功能及其在大型语言模型安全研究中的重要应用。

EasyJailbreakAI对抗大语言模型安全研究Python框架Github开源项目
ToG:基于知识图谱的大型语言模型深度推理与负责任推理

ToG:基于知识图谱的大型语言模型深度推理与负责任推理

ToG (Think-on-Graph) 是一种创新的方法,旨在利用知识图谱增强大型语言模型的推理能力,实现更深入、更负责任的推理。本文详细介绍了ToG的工作原理、实验结果及其在提高模型知识可访问性和责任性方面的应用。

知识图谱大语言模型深度推理ICLR 2024ToGGithub开源项目
RoleLLM: 一个突破性的大型语言模型角色扮演框架

RoleLLM: 一个突破性的大型语言模型角色扮演框架

RoleLLM是一个创新的框架,旨在评估、激发和增强大型语言模型的角色扮演能力。通过四个关键阶段,RoleLLM为自然语言处理领域带来了新的可能性,使AI能够更好地模仿各种角色,提升人机交互体验。

RoleLLM大语言模型角色扮演基准测试微调Github开源项目