大语言模型:精选AI工具、网站与开源项目

大语言模型

SciPhi-Mistral-7B-32k

SciPhi-Mistral-7B-32k

Transformer大语言模型

基于Mistral-7B-v0.1增强科学推理与教育能力的AI模型

Meta-Llama-3-8B-GGUF

Meta-Llama-3-8B-GGUF

大语言模型自然语言处理

Meta Llama 3 8B模型的GGUF量化版本 支持8K上下文长度

Llama-3.2-1B-Instruct-GGUF

Llama-3.2-1B-Instruct-GGUF

社区许可协议Huggingface

多语言大型语言模型提升对话与摘要任务表现

deepseek-coder-7b-instruct-v1.5

deepseek-coder-7b-instruct-v1.5

机器学习Github

基于2T代码数据训练的4K上下文智能编程模型

Meta-Llama-3-8B-Instruct-FP8

Meta-Llama-3-8B-Instruct-FP8

模型优化FP8量化

FP8量化版Meta Llama 3实现内存占用减半

gemma-2-27b

gemma-2-27b

HuggingfaceGemma

Google开源的轻量级高性能语言模型Gemma

Mistral-7B-Instruct-v0.3-GPTQ

Mistral-7B-Instruct-v0.3-GPTQ

HuggingfaceGPTQ量化

Mistral 7B指令模型的4位量化优化版本

Hebrew-Mistral-7B

Hebrew-Mistral-7B

Hebrew-Mistral-7BHuggingface

面向希伯来语和英语的通用大型语言模型

EEVE-Korean-10.8B-v1.0

EEVE-Korean-10.8B-v1.0

词汇扩展技术大语言模型

七阶段培训实现韩语大语言模型扩展的高效技术

neural-chat-7b-v3-1

neural-chat-7b-v3-1

模型微调Intel Gaudi 2

在英特尔Gaudi2上优化的mistralai 7B语言模型

decapoda-research-llama-7B-hf

decapoda-research-llama-7B-hf

机器学习Github

Meta AI开发的7B参数开源语言模型

Qwen1.5-72B-Chat

Qwen1.5-72B-Chat

大语言模型开源项目

支持多语言的720亿参数开源语言模型

Qwen2.5-72B

Qwen2.5-72B

Qwen2.5多语言支持

基于727亿参数的预训练语言模型 专注多语言与长文本处理

granite-20b-code-base-8k

granite-20b-code-base-8k

代码生成大语言模型

IBM开源代码生成模型多语言支持与准确性提升

Qwen2.5-Coder-7B-Instruct-AWQ

Qwen2.5-Coder-7B-Instruct-AWQ

Qwen2.5-Coder人工智能

AWQ量化7B参数代码模型支持128K长文本处理

SILMA-9B-Instruct-v1.0

SILMA-9B-Instruct-v1.0

阿拉伯语开源项目

阿拉伯语9B参数AI模型,广泛适应商业场景

pythia-160m-deduped

pythia-160m-deduped

大语言模型可解释性研究

基于Pile数据集训练的160M参数语言模型

open_llama_7b_v2

open_llama_7b_v2

OpenLLaMA开源项目

Meta AI LLaMA开源复刻

pythia-12b-deduped

pythia-12b-deduped

EleutherAIPythia

面向解释性研究的大模型工具集

MGM-7B

MGM-7B

HuggingfaceMGM-7B

基于LLaMA的开源多模态图文理解生成模型