模型训练必备工具推荐:精选AI软件与开源项目

t5_paraphraser

t5_paraphraser

模型训练开源项目

基于T5模型的智能问题重构生成器

Hermes-2-Pro-Mistral-7B

Hermes-2-Pro-Mistral-7B

JSON输出Github

基于Mistral的新一代语言模型 专注函数调用与结构化输出

stories15M_MOE

stories15M_MOE

模型训练开源项目

TinyLLama多专家模型实现故事生成和Shakespeare风格文本

T0_3B

T0_3B

偏见与公平性模型训练

小规模T0模型超越GPT-3,进行零样本自然语言任务处理

Phi-3.5-mini-instruct-GGUF

Phi-3.5-mini-instruct-GGUF

模型训练自然语言处理

多语言轻量级模型,优化高效推理和准确性

filipino-wav2vec2-l-xls-r-300m-official

filipino-wav2vec2-l-xls-r-300m-official

模型训练开源项目

基于XLS-R的菲律宾语语音识别模型

CodeLlama-70b-Instruct-hf

CodeLlama-70b-Instruct-hf

MetaGithub

深入探讨CodeLlama-70B模型的代码生成和应用场景

starcoder

starcoder

生成代码模型训练

支持80多种编程语言的代码生成工具

pythia-6.9b-deduped

pythia-6.9b-deduped

数据集去重Huggingface

面向大规模语言模型研究的开源模型系列

bert_uncased_L-2_H-512_A-8

bert_uncased_L-2_H-512_A-8

计算资源模型训练

小型BERT模型在资源受限环境中的表现及应用策略

FLUX.1-dev-Controlnet-Union

FLUX.1-dev-Controlnet-Union

模型训练开源社区

多控制模式文本到图像生成技术

qnli-electra-base

qnli-electra-base

Github模型

Quora重复问题检测的跨编码器工具

bert-base-turkish-sentiment-cased

bert-base-turkish-sentiment-cased

数据集Github

高精度的土耳其语言情感分析BERT模型

xlm-roberta-large-ner-hrl

xlm-roberta-large-ner-hrl

Huggingface开源项目

十种多语言命名实体识别模型,覆盖高资源语言

pythia-160m-deduped

pythia-160m-deduped

大语言模型可解释性研究

基于Pile数据集训练的160M参数语言模型

kosmos-2.5

kosmos-2.5

模型训练文档转换

文本密集型图像处理的多模态模型

gelectra-large-germanquad

gelectra-large-germanquad

德语问答Haystack

gelectra-large 德语问答模型助力高效信息提取

git-large-coco

git-large-coco

模型训练视觉问答

高级视觉与语言转换:大规模图像到文本模型

bitnet_b1_58-3B

bitnet_b1_58-3B

Huggingface结果评估

开源的RedPajama语言模型再现

X-ALMA-13B-Pretrain

X-ALMA-13B-Pretrain

机器翻译模块化

支持50种语言的模块化翻译架构