大语言模型:精选AI工具、网站与开源项目

大语言模型

Qwen2.5-7B-Instruct-GGUF

Qwen2.5-7B-Instruct-GGUF

大语言模型Github

开源大语言模型GGUF量化版支持多语言和128K长文本处理

Llama-3.2-11B-Vision-Instruct-bnb-4bit

Llama-3.2-11B-Vision-Instruct-bnb-4bit

大语言模型Github

Llama 3.2视觉语言模型的4bit优化版实现快速低资源微调

TinyLlama-1.1B-Chat-v0.3

TinyLlama-1.1B-Chat-v0.3

大语言模型Github

轻量级高性能AI聊天助手 基于3万亿token训练

Meta-Llama-3.1-405B-Instruct-GPTQ-INT4

Meta-Llama-3.1-405B-Instruct-GPTQ-INT4

开源项目模型

Meta Llama 3.1模型的INT4量化版本实现多语言对话

zephyr-7B-beta-AWQ

zephyr-7B-beta-AWQ

Zephyr 7B Beta大语言模型

基于Mistral模型优化的高性能7B开源对话模型,支持AWQ量化部署

MAmmoTH2-8B-Plus

MAmmoTH2-8B-Plus

MAmmoTH2算法评估

基于网络数据的大规模指令微调方法

Meta-Llama-3.1-70B-Instruct-GGUF

Meta-Llama-3.1-70B-Instruct-GGUF

大语言模型Github

LLaMA 3.1模型量化版本集合及性能参数对比

Reflection-70b-PreciseQuant-6bpw-gguf

Reflection-70b-PreciseQuant-6bpw-gguf

开源项目高精度

高精度量化模型 实现接近完美的性能保留

Llava-v1.5-7B-GGUF

Llava-v1.5-7B-GGUF

模型量化模型

轻量级多模态图文处理模型 支持多种精度量化

Qwen2.5-3B-Instruct-GGUF

Qwen2.5-3B-Instruct-GGUF

大语言模型Qwen2.5

高性能3B参数量GGUF格式大语言模型,支持多语言、长文本理解与结构化输出

L3-8B-Stheno-v3.2-GGUF-IQ-Imatrix

L3-8B-Stheno-v3.2-GGUF-IQ-Imatrix

大语言模型开源项目

基于Llama 3的低资源角色扮演大语言模型

Qwen2.5-32B-Instruct-abliterated-v2-GGUF

Qwen2.5-32B-Instruct-abliterated-v2-GGUF

GGUFHuggingface

基于Qwen2.5的无道德限制大语言模型

Llama-3.1-Storm-8B

Llama-3.1-Storm-8B

大语言模型Llama-3.1-Storm-8B

多任务智能的高性能开源语言模型

CodeLlama-7b-Python-hf

CodeLlama-7b-Python-hf

大语言模型Github

Meta推出的Python专用代码生成与理解模型

WizardMath-7B-V1.1

WizardMath-7B-V1.1

机器学习大语言模型

新一代数学推理模型优化Mistral-7B架构实现卓越性能提升

Qwen2.5-Coder-1.5B-Instruct

Qwen2.5-Coder-1.5B-Instruct

长文本处理Qwen2.5-Coder

支持超长文本处理的智能代码生成模型

Baichuan2-7B-Chat

Baichuan2-7B-Chat

Github模型

2.6万亿Tokens训练的双语开源大模型

opt-66b

opt-66b

预训练模型OPT

Meta AI推出OPT系列开源预训练语言模型促进NLP研究

gemma-2-27b-it-GGUF

gemma-2-27b-it-GGUF

大语言模型Github

Gemma-2-27b-it模型的多精度GGUF量化版本

Qwen2.5-7B-bnb-4bit

Qwen2.5-7B-bnb-4bit

大语言模型Qwen2.5

采用4bit量化技术加速Qwen2.5-7B模型并降低70%内存占用