大语言模型:精选AI工具、网站与开源项目

大语言模型

Llama-3.2-1B-Instruct-q4f16_1-MLC

Llama-3.2-1B-Instruct-q4f16_1-MLC

模型开源项目

高性能量化指令模型用于MLC-LLM和WebLLM项目

Llama-3-ELYZA-JP-8B-GGUF

Llama-3-ELYZA-JP-8B-GGUF

模型Llama-3-ELYZA-JP-8B

Llama 3衍生的日英双语大型语言模型 增强日语处理能力

Llama-3.2-3B-Instruct

Llama-3.2-3B-Instruct

UnslothHuggingface

Meta开发的多语言对话和任务型AI模型

Meta-Llama-3.1-70B

Meta-Llama-3.1-70B

Huggingface模型

Meta开发的多语言大型语言模型 支持高级对话和文本生成

llava-v1.6-mistral-7b

llava-v1.6-mistral-7b

模型Huggingface

LLaVA-v1.6:融合图像与文本理解的开源多模态AI模型

llama-3.1

llama-3.1

模型Github

Meta推出新一代多语言大规模语言模型 Llama 3.1

NVLM-D-72B

NVLM-D-72B

模型人工智能

开源前沿级多模态大语言模型 实现视觉语言任务的最新突破

Meta-Llama-3-8B

Meta-Llama-3-8B

模型人工智能

Meta发布Llama 3系列8B参数大语言模型

Qwen2.5-14B-Instruct

Qwen2.5-14B-Instruct

Huggingface模型

多语言支持的高性能指令微调模型

Qwen2-72B-Instruct

Qwen2-72B-Instruct

模型Github

多语言大规模语言模型 支持131K token超长文本处理

pythia-12b

pythia-12b

解释性研究模型

Pythia语言模型套件提供多种规模及训练检查点

llama-3-8b-Instruct-bnb-4bit

llama-3-8b-Instruct-bnb-4bit

Huggingface模型

Unsloth加速的Llama 3微调方案

Mistral-Small-Instruct-2409

Mistral-Small-Instruct-2409

Mistral-Small-Instruct-2409Huggingface

22B参数高性能指令微调语言模型

Llama-2-70b-chat-hf

Llama-2-70b-chat-hf

模型Github

Meta开发的700亿参数对话型语言模型

internlm2_5-7b-chat

internlm2_5-7b-chat

模型InternLM

卓越推理能力与百万字超长上下文的开源大模型

jais-adapted-13b-chat

jais-adapted-13b-chat

Jais开源项目

基于Llama-2的双语英阿大规模语言模型

Orion-14B-Base

Orion-14B-Base

模型Github

卓越的多语言处理和长文本理解能力

DeepSeek-V2.5

DeepSeek-V2.5

Huggingface模型

集成通用与编程能力的先进语言模型

Mixtral-8x7B-Instruct-v0.1-GPTQ

Mixtral-8x7B-Instruct-v0.1-GPTQ

模型量化

Mixtral-8x7B多语言推理模型的GPTQ量化版本

Qwen2.5-7B-Instruct-bnb-4bit

Qwen2.5-7B-Instruct-bnb-4bit

transformersHuggingface

快速高效的大语言模型微调工具