大语言模型:精选AI工具、网站与开源项目

大语言模型

Abel-7B-002

Abel-7B-002

数学能力性能评估

数学推理能力卓越的7B参数大语言模型

Llama-3.1-405B-Instruct-FP8

Llama-3.1-405B-Instruct-FP8

模型Llama 3.1

Meta开发的多语言大规模语言模型,支持对话和文本生成

LLaVA-NeXT-Video-7B-hf

LLaVA-NeXT-Video-7B-hf

模型人工智能

先进多模态AI模型实现视频和图像理解

Qwen2.5-32B-Instruct-GGUF

Qwen2.5-32B-Instruct-GGUF

模型量化

全面汇总32B大语言模型量化版本 多设备支持

Qwen2.5-7B-Instruct

Qwen2.5-7B-Instruct

Huggingface模型

高效微调和内存优化的多语言大模型

Mistral-Nemo-Instruct-2407-GGUF

Mistral-Nemo-Instruct-2407-GGUF

Mistral-Nemo-InstructHuggingface

多语言指令微调大规模语言模型

gemma-2-9b-it-SimPO

gemma-2-9b-it-SimPO

模型Huggingface

基于SimPO算法的Gemma模型性能提升

Llama-3.1-Nemotron-70B-Instruct

Llama-3.1-Nemotron-70B-Instruct

Huggingface模型

NVIDIA定制的大型语言模型Nemotron-70B-Instruct提高AI回应有用性

deplot

deplot

图表问答DePlot

创新图表理解技术实现一次性视觉语言推理

Qwen2-1.5B

Qwen2-1.5B

模型Github

优秀性能和多语言能力的开源大语言模型

glm-4-9b-chat

glm-4-9b-chat

模型工具调用

多语言支持和长文本处理的开源预训练模型

mpt-7b

mpt-7b

Huggingface模型

高性能开源大语言模型

Llama-3.1-405B-FP8

Llama-3.1-405B-FP8

Huggingface模型

Meta推出的405B参数多语言AI模型支持128K上下文

Llama-3.2-3B-bnb-4bit

Llama-3.2-3B-bnb-4bit

微调模型

Unsloth技术优化Llama-3.2模型微调 加速训练节省内存

open_llama_7b

open_llama_7b

Huggingface模型

开源复现的大规模语言模型媲美原版LLaMA

open_llama_3b_v2

open_llama_3b_v2

模型模型权重

高性能开源大型语言模型复现LLaMA

Meta-Llama-3.1-70B-Instruct-GPTQ-INT4

Meta-Llama-3.1-70B-Instruct-GPTQ-INT4

模型量化

INT4量化版提升多语言对话效率

Llama-3.2-1B-Instruct-AWQ

Llama-3.2-1B-Instruct-AWQ

模型Llama 3.2

Meta发布的开源多语言大型语言模型

gemma-2-9b-bnb-4bit

gemma-2-9b-bnb-4bit

微调模型

开源工具加速大型语言模型微调并降低内存占用

Llama-2-70b-hf

Llama-2-70b-hf

模型Github

Meta开发的70亿参数开源大语言模型 支持多样化自然语言处理任务