大语言模型:精选AI工具、网站与开源项目

大语言模型

DeepSeek-V2: 经济高效的专家混合语言模型

DeepSeek-V2: 经济高效的专家混合语言模型

DeepSeek-V2是一个强大、经济且高效的专家混合(MoE)语言模型,具有2360亿参数,每个token激活210亿参数,支持128K上下文长度。它采用创新的多头潜在注意力(MLA)和DeepSeekMoE架构,在保证模型性能的同时大幅降低了训练和推理成本。

DeepSeek-V2混合专家模型大语言模型预训练模型自然语言处理Github开源项目
Lawrence Technological University: 培养未来创新者的顶尖理工学府

Lawrence Technological University: 培养未来创新者的顶尖理工学府

Lawrence Technological University是一所位于密歇根州的私立理工大学,以培养科技创新人才著称。本文全面介绍了LTU的学术特色、校园生活、就业前景等方面,展现了这所大学在培养未来科技领袖方面的卓越成就。

LTULTU-AS音频理解语音理解大语言模型Github开源项目
Intel Neural Compressor: 加速深度学习推理的开源工具

Intel Neural Compressor: 加速深度学习推理的开源工具

Intel Neural Compressor是一个开源的Python库,旨在通过量化、剪枝等技术来压缩和优化深度学习模型,从而在Intel硬件上实现更快的推理速度。

模型压缩量化深度学习框架Intel Neural Compressor大语言模型Github开源项目
QAnything: 一款强大的本地知识库问答系统

QAnything: 一款强大的本地知识库问答系统

QAnything是由网易有道开发的一款本地知识库问答系统,支持多种文件格式,可离线安装使用。本文详细介绍了QAnything的主要特性、架构设计、最新更新以及使用方法,展示了其在文档解析和智能问答方面的强大能力。

QAnything知识库问答系统大语言模型文件格式支持BCEmbeddingGithub开源项目
FastChat: 开源大型语言模型训练、服务和评估平台

FastChat: 开源大型语言模型训练、服务和评估平台

FastChat是一个开源平台,用于训练、部署和评估基于大型语言模型的聊天机器人。它提供了最先进模型的权重、训练代码和评估代码,以及具有Web UI和兼容OpenAI的RESTful API的分布式多模型服务系统。

FastChat大语言模型聊天机器人开源平台APIGithub开源项目
JetMoE:以0.1百万美元成本达到Llama2性能的革命性大语言模型

JetMoE:以0.1百万美元成本达到Llama2性能的革命性大语言模型

JetMoE-8B是一个突破性的大语言模型,以不到100万美元的成本达到了Llama2-7B的性能水平。这项研究展示了大语言模型训练可以比之前认为的更加经济高效,为AI研究和应用开辟了新的可能性。

JetMoE大语言模型开源性能低成本Github开源项目
LLMLingua: 突破大语言模型推理瓶颈的高效提示压缩技术

LLMLingua: 突破大语言模型推理瓶颈的高效提示压缩技术

LLMLingua 是一种创新的提示压缩技术,能够将大语言模型的输入提示压缩高达 20 倍,同时保持模型性能。它通过智能识别和删除非必要信息,显著提高了模型推理效率、降低了成本,并增强了长文本处理能力,为 AI 应用开发带来了革命性的突破。

LLMLingua提示词压缩大语言模型长文本处理推理加速Github开源项目
图结构与大语言模型的融合:Awesome-Graph-LLM 项目解析

图结构与大语言模型的融合:Awesome-Graph-LLM 项目解析

本文深入介绍了 Awesome-Graph-LLM 项目,该项目旨在探索大语言模型与图结构的结合,收集了相关的研究论文和资源,涵盖了数据集、基准测试、PromptLearning、图模型、多模态模型等多个方面。

图模型大语言模型图神经网络多模态模型知识图谱Github开源项目
大型语言模型评估研究综述:方法、数据集与平台

大型语言模型评估研究综述:方法、数据集与平台

本文全面综述了大型语言模型(LLM)评估的最新进展,包括知识与能力评估、对齐性评估、安全性评估等方面,并介绍了相关评估方法、数据集和平台。文章旨在为LLM评估研究提供系统性的参考。

LLMs评估大语言模型知识能力评估对齐性评估安全性评估Github开源项目
SEED-LLaMA: 革新性的大型语言模型训练方法

SEED-LLaMA: 革新性的大型语言模型训练方法

探索SEED-LLaMA如何通过创新的训练方法提升大型语言模型的性能和效率,为AI领域带来突破性进展。

SEED-LLaMA多模态AI助手视觉语言模型大语言模型Github开源项目
GPT4Tools: 革新视觉交互的智能系统

GPT4Tools: 革新视觉交互的智能系统

GPT4Tools是一个基于自我指导的智能系统,能够自动决策、控制和利用不同的视觉基础模型,实现用户与图像的自然交互。它通过低秩适应(LoRA)优化开源大语言模型,具有强大的多模态能力和灵活的扩展性。

GPT4Tools大语言模型视觉基础模型自我指导多模态交互Github开源项目
Meta Llama 3:解锁大语言模型的无限可能

Meta Llama 3:解锁大语言模型的无限可能

Meta公司推出的最新版本Llama 3语言模型,为个人、创作者、研究人员和各种规模的企业提供了强大的自然语言处理能力,开启了人工智能应用的新纪元。

Llama 3大语言模型Meta人工智能开源Github开源项目
Awesome LLM 网络安全工具集:人工智能助力网络安全研究的新纪元

Awesome LLM 网络安全工具集:人工智能助力网络安全研究的新纪元

本文深入探讨了大型语言模型(LLM)在网络安全领域的应用,介绍了一系列利用LLM进行网络安全研究的创新工具,涵盖逆向工程、网络分析、云安全等多个方面,展示了AI如何为网络安全带来新的可能性。

大语言模型网络安全逆向工程代码分析AI辅助工具Github开源项目
Llama模型:开放、强大的大规模语言模型

Llama模型:开放、强大的大规模语言模型

Llama是Meta公司开发的开源大规模语言模型系列,旨在为开发者、研究人员和企业提供强大的AI工具,推动生成式AI的创新和发展。

Llama大语言模型开源人工智能自然语言处理Github开源项目
Chat-Haruhi-Suzumiya: 通过大型语言模型重现动漫角色

Chat-Haruhi-Suzumiya: 通过大型语言模型重现动漫角色

Chat-Haruhi-Suzumiya是一个开源项目,旨在通过大型语言模型模仿凉宫春日等动漫角色的语气、个性和剧情,实现与这些角色的对话交互。项目支持多种角色扮演,并提供了丰富的使用方式和演示。

ChatHaruhi大语言模型角色扮演开源项目AI对话Github
PromptBench: 一个统一的大语言模型评估框架

PromptBench: 一个统一的大语言模型评估框架

PromptBench是微软开发的开源项目,旨在为大语言模型提供一个统一的评估框架。它集成了多种评估方法,包括标准评估、动态评估、对抗性攻击等,为研究人员提供了全面评估大语言模型性能的工具。

PromptBench评估大语言模型对抗性提示Prompt EngineeringGithub开源项目
LLamaTuner: 简单高�效的大语言模型微调工具

LLamaTuner: 简单高效的大语言模型微调工具

LLamaTuner是一个灵活、高效的大语言模型微调工具包,支持多种主流语言模型和微调方法,让用户能够轻松地对大语言模型进行定制化训练。

LLamaTuner大语言模型模型训练数据预处理Supervised fine-tuning datasetGithub开源项目
GeekAI: 开源人工智能助手全套解决方案

GeekAI: 开源人工智能助手全套解决方案

GeekAI是一款功能强大的开源AI助手系统,集成了多个大语言模型和AI绘画功能,提供完整的前后端解决方案,支持快速部署和二次开发。

GeekAIAI助手大语言模型AI绘画开源Github开源项目
BambooAI: 利用大语言模型实现数据分析和自然语言交互的轻量级工具库

BambooAI: 利用大语言模型实现数据分析和自然语言交互的轻量级工具库

BambooAI是一个创新的轻量级工具库,它利用大语言模型(LLMs)的强大能力,为用户提供了一种通过自然语言与数据进行交互的方式。无论是数据分析专家还是编程新手,都能够轻松地利用这个工具来探索数据、获取洞察,从而提高数据分析的效率和可访问性。

BambooAI数据分析大语言模型自然语言处理Python编程Github开源项目
LangChain解析:探索大语言模型应用开发框架

LangChain解析:探索大语言模型应用开发框架

本文深入解析了LangChain开源框架,介绍了其主要模块和使用场景,并通过实例演示了如何利用LangChain开发强大的AI应用。

LangChain大语言模型开源框架Python笔记本chatbotsGithub开源项目