大语言模型:精选AI工具、网站与开源项目

大语言模型

Solo Performance Prompting: 释放大型语言模型的认知协同效应

Solo Performance Prompting: 释放大型语言模型的认知协同效应

Solo Performance Prompting (SPP)是一种创新的提示方法,通过让单个大型语言模型扮演多个角色进行自我协作,充分发挥模型的认知协同效应,提高复杂任务的解决能力。本文详细介绍了SPP的工作原理、应用场景及实验结果。

Solo Performance PromptingGPT-3.5LLama2NAACL2024大语言模型Github开源项目
推荐系统预训练模型论文列表 - 从传统方法到大语言模型的演进

推荐系统预训练模型论文列表 - 从传统方法到大语言模型的演进

本文综述了推荐系统领域预训练模型的发展历程,涵盖了从早期的序列推荐到最新的大语言模型应用,为研究人员提供了全面的文献参考。

Recommend System预训练模型大语言模型数据集用户表示预训练Github开源项目
AgentLego: 增强大语言模型代理的多功能工具API库

AgentLego: 增强大语言模型代理的多功能工具API库

AgentLego是一个开源库,提供丰富的工具API来扩展和增强基于大型语言模型(LLM)的智能代理。它具有多模态扩展能力、灵活的工具接口、易于集成等特点,为LLM代理提供了强大的工具支持。

AgentLego大语言模型视觉感知图像生成语音处理Github开源项目
xFasterTransformer: 英特尔X86平台上的高性能大语言模型推理解决方案

xFasterTransformer: 英特尔X86平台上的高性能大语言模型推理解决方案

本文介绍了英特尔开发的xFasterTransformer项目,这是一个为X86平台优化的大语言模型推理解决方案,具有高性能、高可扩展性等特点,支持多种主流大语言模型的推理加速。

xFasterTransformer大语言模型Xeon高性能Python APIGithub开源项目
EdgeChains: 下一代生成式AI开发框架

EdgeChains: 下一代生成式AI开发框架

EdgeChains是一个基于Jsonnet的TypeScript/JavaScript生成式AI开发框架,专注于解决提示工程和大语言模型部署的复杂挑战。本文深入介绍了EdgeChains的核心特性、设计理念以及它如何帮助开发者构建高效、可扩展的AI应用。

EdgeChainsjsonnet生成式AI大语言模型Kubernetes配置管理Github开源项目
ML-Bench: 评估大型语言模型和智能体在仓库级代码机器学习任务中的表现

ML-Bench: 评估大型语言模型和智能体在仓库级代码机器学习任务中的表现

ML-Bench是一个创新的基准测试框架,旨在评估大型语言模型和智能体在处理仓库级代码的机器学习任务中的能力。它提供了一套全面的测试套件,涵盖了从代码生成到任务理解的多个方面,为人工智能在软件开发领域的应用提供了宝贵的评估工具。

ML-Bench机器学习任务大语言模型GitHub仓库代码评估Github开源项目
激光技术的原理与应用:从基础到前沿

激光技术的原理与应用:从基础到前沿

本文深入探讨了激光技术的基本原理、发展历程和广泛应用,涵盖了激光的工作原理、类型、特性以及在科研、工业、医疗等领域的创新应用,同时介绍了Layer-Selective Rank Reduction等前沿研究方向,全面展现了激光技术的魅力与潜力。

Layer-Selective Rank ReductionLASERtransformer低秩近似大语言模型Github开源项目
X-LLM: 革新大语言模型微调的前沿技术

X-LLM: 革新大语言模型微调的前沿技术

探索X-LLM如何通过将多模态视为外语来引导高级大语言模型的发展,以及其在简化LLM微调过程中的创新应用。

X—LLM大语言模型模型训练训练优化集成开发Github开源项目
LangChain示例项目:构建强大的语言模型应用

LangChain示例项目:构建强大的语言模型应用

LangChain是一个开源框架,旨在简化基于大型语言模型的应用程序开发。本文介绍了LangChain示例项目,展示了如何利用LangChain构建各种强大的AI应用。

LangChain大语言模型生成式AIStreamlit应用问答生成Github开源项目
NeMo-Curator: NVIDIA打造的大规模数据预处理与策划工具包

NeMo-Curator: NVIDIA打造的大规模数据预处理与策划工具包

深入探讨NVIDIA开发的NeMo-Curator项目,这是一个专为大型语言模型(LLMs)设计的可扩展数据预处理和策划工具包,旨在提高AI模型训练数据的质量和效率。

NeMo CuratorGPU加速大语言模型数据集准备Python库Github开源项目
Oatmeal: 一款强大的终端 UI 聊天工具

Oatmeal: 一款强大的终端 UI 聊天工具

Oatmeal 是一款创新的终端 UI 应用程序,可以让用户与大型语言模型进行交互。它支持多种模型后端和编辑器集成,为开发者和技术爱好者提供了一个便捷、高效的 AI 对话平台。

Oatmeal大语言模型终端用户界面聊天应用编辑器集成Github开源项目
MobiLlama: 小巧高效的边缘设备语言模型

MobiLlama: 小巧高效的边缘设备语言模型

MobiLlama是一个开源的小型语言模型,专为边缘设备设计,仅有5亿参数却能实现出色性能,为资源受限场景下的AI应用开辟了新的可能。

MobiLlama大语言模型小语言模型模型下载生成模型Github开源项目
MindNLP: 基于MindSpore的高性能自然语言处理框架

MindNLP: 基于MindSpore的高性能自然语言处理框架

MindNLP是一个易用且高性能的NLP和大语言模型框架,基于MindSpore开发,兼容🤗Huggingface的模型和数据集。

MindNLP自然语言处理预训练模型大语言模型MindSporeGithub开源项目
SqueezeLLM: 大语言模型的高效量化压缩技术

SqueezeLLM: 大语言模型的高效量化压缩技术

SqueezeLLM是一种新型的大语言模型后训练量化框架,通过密集-稀疏量化方法实现了高达3比特的超低精度压缩,同时保持或提高了模型性能,为大规模语言模型的高效部署提供了新的解决方案。

SqueezeLLM量化大语言模型内存优化模型压缩Github开源项目
LLMFlows: 构建简单、明确和透明的LLM应用框架

LLMFlows: 构建简单、明确和透明的LLM应用框架

LLMFlows是一个用于构建简单、明确和透明的大型语言模型(LLM)应用的框架,如聊天机器人、问答系统和智能代理。它提供了最小化的抽象集,让用户能够利用LLM和向量存储来构建结构良好、逻辑明确的应用,而不存在隐藏的提示或LLM调用。

LLMFlows框架大语言模型应用透明性Github开源项目
OmniQuant: 大语言模型的全方位校准量化技术

OmniQuant: 大语言模型的全方位校准量化技术

OmniQuant是一种简单而强大的大语言模型量化技术,可以实现高精度的权重量化和权重-激活量化,并支持在移动设备上部署量化后的大型语言模型。

OmniQuant量化大语言模型LLaMA高效QATGithub开源项目
ModelCache:为大语言模型打造的高效语义缓存系统

ModelCache:为大语言模型打造的高效语义缓存系统

ModelCache是一个专为大语言模型(LLM)设计的语义缓存系统,通过缓存预生成的模型结果,有效减少相似请求的响应时间,显著提升用户体验。本文深入探讨了ModelCache的核心特性、架构设计和应用场景,展示了其在优化LLM服务方面的巨大潜力。

Codefuse-ModelCache语义缓存大语言模型多租户嵌入模型Github开源项目
torchchat: 加速本地大语言模型推理的强大工具

torchchat: 加速本地大语言模型推理的强大工具

torchchat是一个由PyTorch开发的小型代码库,展示了在服务器、桌面和移动设备上无缝运行大型语言模型(LLMs)的能力。它支持多种流行的LLM模型,提供了简单易用的接口,并针对不同平台进行了优化,是进行本地LLM推理的理想选择。

torchchatPython大语言模型PyTorch模型部署Github开源项目
API for Open LLMs: 统一开源大语言模型的后端接口

API for Open LLMs: 统一开源大语言模型的后端接口

API for Open LLMs 是一个为开源大语言模型提供统一后端接口的项目,支持多种主流开源模型,并与 OpenAI API 保持一致的调用方式,为开发者提供便捷的大模型应用开发体验。

OpenAI ChatGPT API大语言模型环境变量模型支持嵌入模型Github开源项目
Gepetto:革命性的AI驱动IDA Pro插件,加速逆向工程过程

Gepetto:革命性的AI驱动IDA Pro插件,加速逆向工程过程

Gepetto是一款创新的IDA Pro插件,利用先进的语言模型技术,为反编译函数提供智能解释和变量重命名功能,大幅提升逆向工程效率。本文深入探讨Gepetto的特性、安装使用方法及其在软件分析领域的重要意义。

GepettoIDA Pro大语言模型插件代码解释Github开源项目