大语言模型:精选AI工具、网站与开源项目

大语言模型

Italia-9B-Instruct-v0.1

Italia-9B-Instruct-v0.1

Italia 9B数据安全

意大利语大型语言模型,适用于金融和公共管理等关键领域

Qwen2-7B-Instruct-abliterated

Qwen2-7B-Instruct-abliterated

Qwen2-7B-Instruct-abliteratedHuggingface

权重正交化在文本生成模型性能中的应用

Mistral-7B-v0.3

Mistral-7B-v0.3

Mistral-7B-v0.3Hugging Face

词汇扩展提升语言模型性能

SeaLLMs-v3-7B-Chat

SeaLLMs-v3-7B-Chat

多语言Github

多语言大语言模型,专注提升东南亚文化信任与对话安全性

shieldgemma-2b

shieldgemma-2b

HuggingfaceShieldGemma

结合安全审核与文本生成技术,实现合规与伦理保障

MAmmoTH2-7B-Plus

MAmmoTH2-7B-Plus

大语言模型Github

增强大型语言模型推理能力的创新研究

Yi-6B

Yi-6B

Huggingface机器学习

开源双语大型语言模型的性能和应用

dolly-v2-12b

dolly-v2-12b

指令调优dolly-v2-12b

Databricks开源商用语言模型

Ovis1.6-Gemma2-9B

Ovis1.6-Gemma2-9B

图像处理Github

Ovis1.6-Gemma2-9B开源多模态大语言模型的嵌入对齐解决方案

h2o-danube3-4b-base

h2o-danube3-4b-base

Github模型

高效大语言模型支持离线运行

dictalm2.0

dictalm2.0

开源项目模型

探索专注于希伯来语词汇与指令优化的生成式语言模型

aya-23-35B

aya-23-35B

Huggingface开源项目

高性能多语言大模型指令微调指南

h2o-danube2-1.8b-chat

h2o-danube2-1.8b-chat

H2O.ai变压器

1.8B参数的聊天模型,提升自然语言生成效果

Llama-3.1-Swallow-70B-Instruct-v0.1

Llama-3.1-Swallow-70B-Instruct-v0.1

日本语言能力开源项目

强化日语和英语能力的多语言大型模型

Qwen2-1.5B-Instruct-GGUF

Qwen2-1.5B-Instruct-GGUF

Transformer架构多语言能力

Qwen2提供出色的多语言支持与兼容性

pythia-1.4b-deduped

pythia-1.4b-deduped

HuggingfaceEleutherAI

用于解释性研究的大规模语言模型套件

Qwen2.5-32B-Instruct-GPTQ-Int8

Qwen2.5-32B-Instruct-GPTQ-Int8

大语言模型Github

开源多语言大模型Qwen2.5 32B量化版支持超长文本处理

LLaMAntino-2-chat-13b-hf-UltraChat-ITA

LLaMAntino-2-chat-13b-hf-UltraChat-ITA

LLaMAntino-2-chat-13b-UltraChat模型

意大利语对话支持增强的大语言模型

Yi-34B-200K

Yi-34B-200K

Huggingface开源项目

开源双语大模型 提升长文本理解能力

internlm2-chat-7b

internlm2-chat-7b

Github模型

70亿参数大模型实现20万字超长文本理解及多场景智能对话