大语言模型:精选AI工具、网站与开源项目

大语言模型

gemma-2-2b-jpn-it

gemma-2-2b-jpn-it

机器学习Github

Gemma 2系列日语大模型实现多任务自然语言处理

InternVL2-26B

InternVL2-26B

InternVL2大语言模型

全新多模态智能体实现长文本多图像及视频的智能理解

Yarn-Mistral-7b-128k

Yarn-Mistral-7b-128k

长上下文大语言模型

基于Mistral-7B的128K长文本语言模型

Qwen2.5-32B-Instruct-AWQ

Qwen2.5-32B-Instruct-AWQ

Qwen2.5Github

支持128K长文本的多语言量化大模型

Qwen2.5-72B-Instruct-AWQ

Qwen2.5-72B-Instruct-AWQ

transformers大语言模型

高性能量化开源大模型 支持多语言及长文本处理的人工智能助手

llama-2-7b-chat-bnb-4bit

llama-2-7b-chat-bnb-4bit

开源项目Llama-2

开源LLM模型训练加速工具实现2至5倍速提升并节省70%内存

huihui-ai_-_Qwen2.5-14B-Instruct-abliterated-v2-gguf

huihui-ai_-_Qwen2.5-14B-Instruct-abliterated-v2-gguf

Qwen2.5-14B大语言模型

Qwen2.5-14B模型无审查量化版本集合

Mistral-Nemo-Base-2407

Mistral-Nemo-Base-2407

开源项目深度学习

Mistral和NVIDIA联合开发的多语言大模型支持128k超长上下文

glm-4-9b-chat-1m-GGUF

glm-4-9b-chat-1m-GGUF

GLM-4Github

基于GLM-4的轻量级中文对话模型量化版本

gemma-2-9b-it-bnb-4bit

gemma-2-9b-it-bnb-4bit

模型微调Gemma

基于Unsloth框架的语言模型量化微调方案

Llama-3-8B-Lexi-Uncensored-GGUF

Llama-3-8B-Lexi-Uncensored-GGUF

大语言模型开源模型

基于Llama-3架构的无限制对话语言模型

openchat-3.5-1210

openchat-3.5-1210

大语言模型人工智能

7B参数规模开源语言模型在多项测试中超越大规模商业模型

Qwen2.5-72B-Instruct-GPTQ-Int4

Qwen2.5-72B-Instruct-GPTQ-Int4

Qwen2.5Github

Qwen2.5-72B模型4位量化版支持128K长文本及多语言处理

TinyLlama-1.1B-Chat-v1.0-GGUF

TinyLlama-1.1B-Chat-v1.0-GGUF

TinyLlama大语言模型

TinyLlama 轻量级语言模型的量化优化版

Hermes-3-Llama-3.1-70B

Hermes-3-Llama-3.1-70B

函数调用大语言模型

基于Llama 3的新一代通用语言模型

Llama-3.1-Nemotron-70B-Instruct-HF-GGUF

Llama-3.1-Nemotron-70B-Instruct-HF-GGUF

Huggingface指令微调

NVIDIA推出支持128K上下文的70B参数指令调优语言模型

Qwen2.5-Math-7B-Instruct-GGUF

Qwen2.5-Math-7B-Instruct-GGUF

大语言模型GGUF

针对性能和空间优化的Qwen2.5数学模型GGUF量化版本

vicuna-13b-v1.5-16k

vicuna-13b-v1.5-16k

大语言模型Llama 2

基于Llama 2的开源对话模型 支持16K长文本处理

pythia-1b

pythia-1b

机器学习人工智能

开放8亿参数的自然语言模型研究工具

vicuna-7b-v1.3

vicuna-7b-v1.3

Huggingface模型

开源对话AI助手 基于LLaMA高性能微调