语言模型工具集锦:AI工具、网站、应用与开源项目精选

gliner_large-v2.5

gliner_large-v2.5

语言模型Github

利用双向变压器编码器的通用命名实体识别模型

Qwen2-72B

Qwen2-72B

Huggingface文本生成

新一代开源大语言模型在多个领域表现出色的中立评估

Qwen1.5-MoE-A2.7B

Qwen1.5-MoE-A2.7B

Mixture of ExpertsHuggingface

提高模型生成速度与资源效率的Transformer架构MoE语言模型

TinyMistral-248M

TinyMistral-248M

Github微调

使用小规模数据集进行高效模型预训练

subnet9_Aug30_c

subnet9_Aug30_c

使用指南开源项目

深入了解最新Transformers模型的特性与潜在应用

Qwen2-1.5B-Ita

Qwen2-1.5B-Ita

语言模型Github

Qwen2 1.5B高效意大利语语言模型表现接近大型模型

dictalm2.0-instruct

dictalm2.0-instruct

自然语言生成开源项目

支持对话功能的希伯来语大型语言模型

maestrale-chat-v0.4-beta

maestrale-chat-v0.4-beta

Github微调

优化意大利语语言处理的SFT与DPO对齐模型

Bielik-7B-Instruct-v0.1

Bielik-7B-Instruct-v0.1

波兰语Bielik-7B-Instruct-v0.1

波兰语语言模型的优化与训练方法

Qwen2-1.5B-Instruct-GPTQ-Int4

Qwen2-1.5B-Instruct-GPTQ-Int4

量化Huggingface

多语言大模型Qwen2,增强理解与推理性能

wav2vec2-xlsr-1b-finnish-lm-v2

wav2vec2-xlsr-1b-finnish-lm-v2

芬兰语语音识别

芬兰语语音识别模型精调,提升语音转文字效果

Qwen2-1.5B-Instruct-AWQ

Qwen2-1.5B-Instruct-AWQ

Qwen2Huggingface

探索具备多语言能力和高性能的新一代语言模型

prot_bert_bfd

prot_bert_bfd

掩码语言模型Huggingface

用于自监督蛋白质序列分析的ProtBert-BFD模型

Llama3.1-70B-Chinese-Chat

Llama3.1-70B-Chinese-Chat

开源项目Llama3.1-70B-Chinese-Chat

中英双语优化的Llama3.1-70B指令微调模型

dpr-reader-single-nq-base

dpr-reader-single-nq-base

Dense Passage Retrieval自然问题数据集

基于自然问题数据集的开放域问答工具

Llama-2-ko-7b-Chat

Llama-2-ko-7b-Chat

Github开源项目

Llama-2拓展到韩语文本生成的进展与优化

Qwen1.5-32B-Chat-GGUF

Qwen1.5-32B-Chat-GGUF

Github模型

基于Transformer架构的多语言解码模型

granite-7b-base

granite-7b-base

开源项目Granite-7b-base

开源模型Granite-7b-base的结构与应用解析

Qwen1.5-1.8B-Chat

Qwen1.5-1.8B-Chat

HuggingfaceQwen1.5

跨语言能力与性能优化的前沿语音模型

POLAR-14B-v0.2

POLAR-14B-v0.2

Github开源项目

韩文大语言模型助力生态系统