语言模型工具集锦:AI工具、网站、应用与开源项目精选

Llama3-8B-Chinese-Chat-GGUF-4bit

Llama3-8B-Chinese-Chat-GGUF-4bit

Llama3-8B-Chinese-ChatHuggingface

支持中英文交流的跨语言模型功能

visualglm-6b

visualglm-6b

语言模型Huggingface

中英文图像交互的多模态对话模型

orca_mini_v3_13b

orca_mini_v3_13b

模型评估语言模型

增强文本生成的Orca与Llama2结合模型

tamil-llama-7b-instruct-v0.1

tamil-llama-7b-instruct-v0.1

机器学习Github

改进泰米尔文本生成的高性能语言模型

tweet-topic-21-multi

tweet-topic-21-multi

多标签分类推文

适用于英文多标签话题分类的推文模型

Qwen2.5-14B-Instruct-GGUF

Qwen2.5-14B-Instruct-GGUF

Github长上下文支持

提升语言生成能力支持多语言的14B指令微调模型

Qwen1.5-4B-Chat

Qwen1.5-4B-Chat

开源项目模型

支持多语种与长上下文的高级语言模型

v3_1_pt_ep1_sft_5_based_on_llama3_1_8b_final_data_20241019

v3_1_pt_ep1_sft_5_based_on_llama3_1_8b_final_data_20241019

语言模型训练细节

探索先进的自然语言处理开源模型及其实际应用

mamba-2.8b-hf

mamba-2.8b-hf

生成API开源项目

Mamba-2.8b-hf的transformers兼容性与使用指南

ghost-7b-alpha

ghost-7b-alpha

Huggingface开源项目

先进的语言生成工具,具备优化推理和多任务处理能力

OLMo-7B-0724-Instruct-hf

OLMo-7B-0724-Instruct-hf

语言模型Github

改进自然语言处理任务的问答精度与模型性能

open-calm-small

open-calm-small

CyberAgent日本语

高效日语Transformer模型,探索OpenCALM-Small的关键特性

camembert-L4

camembert-L4

Huggingface特征提取

精简版法语BERT模型,支持文本分类和语义搜索

MicroLlama

MicroLlama

开源项目huggingface

预算内的大规模语言模型构建:300M Llama模型的探索

Ministral-3b-instruct-GGUF

Ministral-3b-instruct-GGUF

开源项目NLP

更高效的量化语言模型,为文本生成带来显著性能提升

controlnet-sd21-depth-diffusers

controlnet-sd21-depth-diffusers

diffusersStable Diffusion

控制稳定扩散与艺术生成的革新选择

stablelm-2-1_6b-chat

stablelm-2-1_6b-chat

语言模型训练数据集

1.6亿参数的对话模型

switch-base-128

switch-base-128

语言模型Github

探索语言模型优化与参数缩放的最新进展

Qwen2-72B-Instruct-GPTQ-Int4

Qwen2-72B-Instruct-GPTQ-Int4

生成能力语言模型

提升多语言处理能力,支持超长文本输入

Platypus2-13B

Platypus2-13B

机器学习Github

LLaMA2架构下通过指令微调优化的模型及其表现