大语言模型:精选AI工具、网站与开源项目

大语言模型

Qwen2.5-3B

Qwen2.5-3B

Huggingface模型

新一代多语言模型提升代码数学和长文本处理能力

Qwen2-72B-Instruct-AWQ

Qwen2-72B-Instruct-AWQ

AWQHuggingface

先进的大规模语言模型 131K Token上下文长度

Llama-2-7B-Chat-GGUF

Llama-2-7B-Chat-GGUF

模型量化

Llama 2对话模型的量化版本 支持多种推理环境

Qwen1.5-14B-Chat

Qwen1.5-14B-Chat

模型聊天模型

Qwen1.5系列多语言大规模语言模型支持32K上下文

Llama-3.2-3B-Instruct-GGUF

Llama-3.2-3B-Instruct-GGUF

模型量化

Llama-3.2-3B-Instruct模型的多种量化优化版本

Llama-3_1-Nemotron-51B-Instruct

Llama-3_1-Nemotron-51B-Instruct

模型神经网络架构搜索

NVIDIA开发的高效大语言模型

llama-3-8b-bnb-4bit

llama-3-8b-bnb-4bit

Llama 3模型

大语言模型微调工具提升训练速度并降低内存使用

Mistral-Nemo-Instruct-2407-vllm-fp8

Mistral-Nemo-Instruct-2407-vllm-fp8

Mistral-Nemo-Instruct-2407Huggingface

开源多语言指令微调大模型

WizardLM-2-7B-GGUF

WizardLM-2-7B-GGUF

模型量化

基于Mistral-7B的多语言对话模型 支持复杂任务和推理

Qwen2.5-3B-Instruct

Qwen2.5-3B-Instruct

模型Qwen2.5

高性能多语言AI模型支持长文本处理

Skywork-Reward-Llama-3.1-8B-v0.2

Skywork-Reward-Llama-3.1-8B-v0.2

模型Reward Model

小型数据集训练的高性能奖励模型实现卓越偏好处理

Llama-2-7B-GPTQ

Llama-2-7B-GPTQ

模型Github

Llama 2 7B的GPTQ量化版本 支持多种参数选项

Meta-Llama-3.1-8B-bnb-4bit

Meta-Llama-3.1-8B-bnb-4bit

模型模型微调

Unsloth技术实现高效低资源的Llama 3.1模型微调

Qwen2-0.5B-Instruct

Qwen2-0.5B-Instruct

模型Github

轻量级高性能指令对话模型 提升自然语言处理能力

Llama-2-7B-Chat-GPTQ

Llama-2-7B-Chat-GPTQ

模型Llama 2

Meta Llama 2推出的开源7B参数对话模型量化版

Mistral-Nemo-Instruct-2407

Mistral-Nemo-Instruct-2407

Mistral-Nemo-Instruct-2407Huggingface

多语言指令微调开源大语言模型

Mixtral-8x22B-Instruct-v0.1

Mixtral-8x22B-Instruct-v0.1

Huggingface模型

多语言指令微调大型语言模型

Prompt-Guard-86M

Prompt-Guard-86M

模型提示攻击

AI应用的安全防护模型

Meta-Llama-3.1-8B-Instruct-GPTQ-INT4

Meta-Llama-3.1-8B-Instruct-GPTQ-INT4

模型量化

Meta-Llama-3.1-8B-Instruct模型的INT4量化版本

gemma-2-9b

gemma-2-9b

模型人工智能

Google推出的轻量级开源大语言模型适用于资源有限环境