大语言模型:精选AI工具、网站与开源项目

大语言模型

Llama-3.2-1B-bnb-4bit

Llama-3.2-1B-bnb-4bit

模型Llama 3.2

Llama-3.2-1B模型训练加速与内存优化工具

Llama-3-ELYZA-JP-8B

Llama-3-ELYZA-JP-8B

模型开源项目

ELYZA开发的日英双语自然语言处理模型

Meta-Llama-3.1-8B-Instruct-GGUF

Meta-Llama-3.1-8B-Instruct-GGUF

模型多语言

Llama 3.1 8B多语言AI模型 具备128K上下文处理能力

pythia-160m

pythia-160m

模型EleutherAI

EleutherAI开发的160M参数语言模型 专为NLP研究设计

Meta-Llama-3-8B-Instruct

Meta-Llama-3-8B-Instruct

模型人工智能

Meta开发的大规模语言模型 支持多种自然语言处理任务

Qwen-1_8B-Chat

Qwen-1_8B-Chat

Huggingface模型

18亿参数规模的高性能大语言模型

vicuna-13b-v1.5

vicuna-13b-v1.5

模型Github

基于Llama 2的开源对话AI助手,展现卓越性能

Llama-3.2-1B-Instruct-GGUF

Llama-3.2-1B-Instruct-GGUF

模型模型训练

Llama 3.2语言模型微调加速与优化工具

open_llama_3b

open_llama_3b

模型Github

开源复现LLaMA架构的大型语言模型

Meta-Llama-3.1-70B-Instruct-AWQ-INT4

Meta-Llama-3.1-70B-Instruct-AWQ-INT4

AutoAWQHuggingface

Llama 3.1 70B指令模型INT4量化版 多语言对话优化

flan-t5-xl

flan-t5-xl

模型多语言

基于指令微调的多语言NLP模型

Meta-Llama-3.1-8B-Instruct-AWQ-INT4

Meta-Llama-3.1-8B-Instruct-AWQ-INT4

Meta-Llama-3.1AutoAWQ

高性能4比特量化优化版本

flan-ul2

flan-ul2

模型预训练

多语言encoder-decoder模型 适用于翻译问答和逻辑推理

falcon-7b-instruct

falcon-7b-instruct

Huggingface模型

高性能指令微调语言模型

Llama-3.2-11B-Vision-Instruct

Llama-3.2-11B-Vision-Instruct

UnslothHuggingface

高效训练和部署具有多语言能力的大规模语言模型

Qwen2.5-32B-Instruct

Qwen2.5-32B-Instruct

模型多语言支持

多语言大规模语言模型支持长文本处理和结构化输出

Llama-3.1-70B

Llama-3.1-70B

模型Github

Meta Llama 3.1 突破性多语言大模型 支持128K上下文

InternVL2-4B

InternVL2-4B

多模态Huggingface

先进多模态大语言模型探索视觉语言理解新高度

SOLAR-10.7B-Instruct-v1.0

SOLAR-10.7B-Instruct-v1.0

模型开源项目

高效小巧的大型语言模型在多项NLP任务中超越更大规模对手

Qwen2.5-0.5B

Qwen2.5-0.5B

模型Qwen2.5

轻量级多语言预训练模型 支持长上下文和结构化输出