语言模型工具集锦:AI工具、网站、应用与开源项目精选

T0pp

T0pp

语言模型T0

多任务语言模型展现跨任务零样本泛化能力

NemoMix-Unleashed-12B-GGUF

NemoMix-Unleashed-12B-GGUF

模型量化

NemoMix-Unleashed-12B模型的多种量化版本

opus-mt-en-fi

opus-mt-en-fi

语言模型机器翻译

开源神经机器翻译模型实现英语到芬兰语的准确转换

Llama-3.1-SauerkrautLM-8b-Instruct

Llama-3.1-SauerkrautLM-8b-Instruct

语言模型模型

Spectrum微调的德英双语Llama模型

Meta-Llama-3.1-70B-Instruct-FP8

Meta-Llama-3.1-70B-Instruct-FP8

语言模型Huggingface

Meta-Llama-3.1-70B模型的FP8量化版本 提升效率降低资源需求

biomed_roberta_base

biomed_roberta_base

语言模型Huggingface

RoBERTa衍生模型在生物医学NLP任务中展现优异性能

Sheared-LLaMA-1.3B

Sheared-LLaMA-1.3B

模型开源项目

高效压缩训练的小型语言模型

RADAR-Vicuna-7B

RADAR-Vicuna-7B

语言模型Huggingface

对抗学习训练的AI文本识别模型

EXAONE-3.0-7.8B-Instruct

EXAONE-3.0-7.8B-Instruct

EXAONE-3.0-7.8B-Instruct语言模型

高性能双语指令微调大语言模型

ATTACK-BERT

ATTACK-BERT

模型网络安全

ATT&CK BERT网络安全语义分析模型

opus-mt-ja-en

opus-mt-ja-en

模型日英翻译

基于OPUS数据集的日英神经机器翻译模型

robeczech-base

robeczech-base

模型Github

专为捷克语开发的单语RoBERTa模型

Vikhr-7B-instruct_0.4

Vikhr-7B-instruct_0.4

Vikhr语言模型

俄英双语指令微调大模型新版本提升性能

pythia-70m-deduped

pythia-70m-deduped

模型Github

促进语言模型可解释性的研究工具

L3-Umbral-Mind-RP-v3.0-8B

L3-Umbral-Mind-RP-v3.0-8B

模型Llama-3

专为重度主题角色扮演优化的开源AI语言模型

Nous-Hermes-Llama2-13b

Nous-Hermes-Llama2-13b

语言模型Llama-2

开源语言模型专注长回复与准确性

phi-1_5

phi-1_5

语言模型模型

13亿参数的语言模型展现卓越性能

OpenHermes-2.5-Mistral-7B

OpenHermes-2.5-Mistral-7B

语言模型模型

Mistral-7B微调模型 OpenHermes-2.5 展现强大通用及编程能力

Phi-3-medium-128k-instruct

Phi-3-medium-128k-instruct

语言模型Huggingface

14B参数轻量级开源大语言模型支持128K上下文

Jamba-v0.1

Jamba-v0.1

模型开源项目

混合SSM-Transformer架构的高性能大语言模型