大语言模型
本文深入探讨了LLMOps(大型语言模型运维)的概念、最佳实践和相关工具,为开发者提供了全面的LLMOps指南。从基础概念到具体工具,本文涵盖了LLMOps的方方面面,是一份不可多得的LLMOps学习资料。
Motif是一个创新的强化学习框架,利用大语言模型的反馈来生成智能体的内在奖励函数,从而实现更加灵活和可解释的智能体行为。本文将详细介绍Motif的工作原理、主要特点及其在NetHack游戏中的应用成果。
本文全面介绍了大语言模型(LLM)的发展历程、最新进展和实践应用。从里程碑论文到开源模型,从训练框架到部署工具,为读者呈现了LLM领域的全景图,助力深入理解和应用这一改变世界的AI技术。
EfficientQAT是一种新型的大语言模型量化技术,通过两阶段训练实现高效压缩,在保持性能的同时大幅减少模型存储需求。本文深入介绍EfficientQAT的原理、优势及其在各类大语言模型上的应用效果。
DriveMLM是一个基于大语言模型的自动驾驶框架,能够在真实模拟器中实现闭环自动驾驶。该框架通过标准化决策状态、利用多模态大语言模型进行行为规划、设计有效的数据引擎等创新方法,成功实现了语言决策与车辆控制的对接,为自动驾驶领域的大语言模型应用开辟了新的方向。
ControlLLM是一个创新的框架,通过图搜索方法赋予大语言模型使用多模态工具的能力,可以解决复杂的现实世界任务。本文详细介绍了ControlLLM的工作原理、主要特性和应用场景,展示了其在图像、音频、视频等多模态任务中的优越性能。
VTimeLLM是一个创新的视频大语言模型,专为细粒度视频时刻理解和推理而设计。它采用了边界感知的三阶段训练策略,显著提升了视频理解和推理能力,在多项视频相关任务中大幅超越现有模型。
FuseAI项目致力于通过知识融合技术提升大型语言模型的性能。本文介绍了FuseAI的最新进展,包括FuseLLM和FuseChat两个子项目,探讨了知识融合技术在提升模型能力方面的潜力和应用。
一个用原生PyTorch实现的RWKV大语言模型推理框架,支持批量推理、并行推理等特性,代码简洁易读易扩展,让我们一起加入灵活的PyTorch生态,共同开源RWKV!
FinRobot是一个开源的人工智能代理平台,专为金融应用而设计。它整合了多种AI技术,包括大型语言模型,为金融行业提供了全面的解决方案。本文深入探讨了FinRobot的架构、功能和应用前景。
Levanter是由斯坦福大学CRFM研究中心开发的开源大语言模型训练框架,致力于实现可读性强、可扩展和可重现的基础模型训练。本文深入介绍了Levanter的主要特性、使用方法及其在大规模语言模型训练中的应用。
OpenFedLLM是一个开源的研究代码库,旨在通过联邦学习的方式在分散的私有数据上训练大语言模型,为解决数据隐私和合规性问题提供了新的思路。
Haystack Cookbook是一个包 含各种示例笔记本的集合,展示了如何利用Haystack框架构建先进的问答和检索系统。本文将详细介绍Haystack Cookbook的主要特性、使用方法和示例,帮助开发者快速上手这个强大的NLP工具。
本文对大型语言模型(LLMs)效率优化的最新研究进行了全面综述,涵盖了模型中心、数据中心和框架中心三个主要方面的优化技术。文章系统地梳理了现有文献,分析了LLMs效率优化的关键挑战和解决方案,为研究人员和实践者提供了宝贵的参考资源。
DataTalksClub推出的LLM Zoomcamp课程,通过10周的学习,教你如何利用大型语言模型构建智能问答系统,从基础理论到实战项目全面覆盖。
text-generation-webui是一个基于Gradio的大语言模型Web UI,旨在成为文本生成领域的'AUTOMATIC1111/stable-diffusion-webui'。它支持多种后端,提供丰富的功能,并且易于安装使用。
EvalScope是由ModelScope团队开发的开源框架,旨在为大型模型(包括大型语言模型和多模态大型语言模型)提供全面、客观的评估。它集成了多种评估数据集、评估指标和自动化评估工具,支持多种评估模式,并可生成可视化报告,是研究人员和开发者进行模型评估的有力工具。