语言模型工具集锦:AI工具、网站、应用与开源项目精选

openchat-3.6-8b-20240522

openchat-3.6-8b-20240522

机器学习Huggingface

基于Llama 3架构的混合数据训练语言模型

phobert-large

phobert-large

语言模型Github

越南语PhoBERT模型优化实现多项NLP任务性能突破

Yi-Ko-6B

Yi-Ko-6B

Github模型

多语言大规模自动回归模型优化文本生成性能

LLaMA-2-7B-32K

LLaMA-2-7B-32K

Github模型

基于Llama-2开发的32K长文本理解模型

OpenHermes-2-Mistral-7B

OpenHermes-2-Mistral-7B

OpenHermes开源项目

基于Mistral-7B的高性能多任务语言模型

magnum-v2-12b-gguf

magnum-v2-12b-gguf

GPU训练微调

基于Claude 3优化的量化多语言聊天模型

data2vec-audio-base-960h

data2vec-audio-base-960h

自动语音识别语言模型

利用自监督学习提升语音识别效率的开源框架

ruBert-base

ruBert-base

语言模型ruBert

专为俄语遮蔽填充任务优化的Transformer预训练语言模型

StableBeluga-7B

StableBeluga-7B

语言模型Stable Beluga 7B

Llama2基础上的稳定新型语言模型

alephbert-base

alephbert-base

语言模型Github

优化希伯来语自然语言处理的先进语言模型

LaMini-T5-738M

LaMini-T5-738M

Huggingface人工智能

高效精简的738M参数T5语言模型

pythia-6.9b-deduped

pythia-6.9b-deduped

数据集去重Huggingface

面向大规模语言模型研究的开源模型系列

InRanker-base

InRanker-base

InRanker信息检索

增强跨领域场景信息检索的AI解决方案

Infinity-Instruct-3M-0625-Llama3-8B

Infinity-Instruct-3M-0625-Llama3-8B

语言模型北京人工智能学会

开源调优模型,无RLHF实现性能突破

multitask-text-and-chemistry-t5-base-augm

multitask-text-and-chemistry-t5-base-augm

IBM研究院多任务

多任务文本与化学T5适用于化学与自然语言的多领域模型

ctrl

ctrl

语言模型Github

条件Transformer语言模型的功能与应用

reward-model-deberta-v3-large-v2

reward-model-deberta-v3-large-v2

Github模型

人类反馈训练奖励模型 提升问答评估和强化学习效果

Yi-6B-200K

Yi-6B-200K

技术报告Huggingface

提供中英文双语支持的开源大语言模型

Mono-InternVL-2B

Mono-InternVL-2B

InternLM2Github

原生多模态大语言模型融合视觉与文本能力

kf-deberta-base

kf-deberta-base

基准测试语言模型

金融领域专用语言模型展示出色性能