模型训练必备工具推荐:精选AI软件与开源项目

dolphin-2.9.3-mistral-nemo-12b-gguf

dolphin-2.9.3-mistral-nemo-12b-gguf

对话生成模型训练

提供指令跟随与无偏见对话的先进AI解决方案

4th-tail-merges-050wai70-sdxl

4th-tail-merges-050wai70-sdxl

模型训练动漫绘画

基于SDXL的二次元风格小马生成模型

mxbai-rerank-large-v1

mxbai-rerank-large-v1

模型训练自然语言处理

基于Transformers的文本智能重排序模型

clip

clip

模型训练Optimum Habana

Habana Gaudi HPU优化的视觉语言模型配置与训练方案

TinyStories-33M

TinyStories-33M

模型训练开源项目

基于GPT-Neo架构的开源文本生成模型

SmolLM-360M

SmolLM-360M

Github神经网络

3.6亿参数的高效语言模型 专注常识推理和知识理解

tct_colbert-msmarco

tct_colbert-msmarco

模型训练深度学习

知识蒸馏技术驱动的密集文档检索深度学习模型

japanese-sentiment-analysis

japanese-sentiment-analysis

高精度模型训练

基于chABSA数据集的日语情感分析模型,具有高准确率和F1分数

gliner_large-v1

gliner_large-v1

GLiNER双向变压器编码器

资源友好的多实体识别模型,为多种应用场合提供灵活解决方案

sentence-bert-base-italian-xxl-uncased

sentence-bert-base-italian-xxl-uncased

句子嵌入模型训练

提升语义分析与聚类效果的意大利语句子相似度模型

Fluently-XL-v2

Fluently-XL-v2

模型训练Fluently XL

SDXL图像模型融合艺术写实风格优化解剖结构表现

japanese-roberta-base

japanese-roberta-base

Github开源项目

日语RoBERTa模型适用于掩码语言建模

bert-multilingual-passage-reranking-msmarco

bert-multilingual-passage-reranking-msmarco

Huggingface机器学习

BERT多语言文本重排序模型优化搜索效果

prometheus-bgb-8x7b-v2.0

prometheus-bgb-8x7b-v2.0

Huggingface机器学习

Transformers模型标准化文档模板及最佳实践

wav2vec2

wav2vec2

Github模型

Wav2Vec2模型在Habana Gaudi处理器上的优化训练配置

nli-deberta-v3-large

nli-deberta-v3-large

模型训练Natural Language Inference

高效实现自然语言推断的跨编码器

NSFW-6B

NSFW-6B

模型训练开源项目

人工智能领域中挑战伦理界限的研究模型

nomic-embed-vision-v1.5

nomic-embed-vision-v1.5

模型训练开源项目

高性能视觉嵌入模型实现多模态共享空间

tiny-random-idefics2

tiny-random-idefics2

神经网络Huggingface

面向测试开发的轻量级Idefics2多模态交互模型

Baichuan2-7B-Chat

Baichuan2-7B-Chat

Github模型

2.6万亿Tokens训练的双语开源大模型