模型训练必备工具推荐:精选AI软件与开源项目

deepseek-moe-16b-base

deepseek-moe-16b-base

代码生成模型训练

采用稀疏混合专家架构的开源大语言模型

roberta-large

roberta-large

模型训练开源项目

基于HPU的深度学习模型优化配置和训练方案

ja_classification

ja_classification

模型训练Huggingface

准确率达98.47%的日语文本分类模型

softserve_anime

softserve_anime

模型训练Safetensors

风格化图像生成的最新Flux Dev模型

model

model

模型训练开源项目

高效文本生成的突破:快速模型训练与推理

deepseek-coder-6.7B-base-AWQ

deepseek-coder-6.7B-base-AWQ

模型训练PyTorch

大规模训练的代码语言模型,支持项目级代码补全和填充

Asifmodel

Asifmodel

模型训练Llama

基于Unsloth和TRL库加速训练的LLaMA模型

DiVA-llama-3-v0-8b

DiVA-llama-3-v0-8b

语音识别Github

基于Llama的端到端双模态语音助手系统

pegasus-cnn_dailymail

pegasus-cnn_dailymail

模型训练自然语言处理

突破性混合训练文本摘要模型在新闻数据集实现44.16% ROUGE-1评分

stsb-bert-tiny-onnx

stsb-bert-tiny-onnx

语义相似度文本嵌入

基于BERT的轻量级文本向量化模型

openchat-3.5-0106-gemma

openchat-3.5-0106-gemma

模型训练开源项目

OpenChat 3.5基于Gemma的强大语言模型新基准

SQL_Llama-3.2-3B-Instruct-uncensored_final-gguf

SQL_Llama-3.2-3B-Instruct-uncensored_final-gguf

Github模型

Llama模型驱动的高效SQL指令生成工具

phobert-base-vi-sentiment-analysis

phobert-base-vi-sentiment-analysis

Github情绪分类

越南语情感分析工具,实现文本情绪精确判定

transliterate

transliterate

模型训练Github

高精度自然语言音译转换模型达99.12%准确率

subnet9_best

subnet9_best

模型文档模型训练

深度学习模型评估与文档标准化模板

polyglot-ko-12.8b-Inst

polyglot-ko-12.8b-Inst

Huggingface文本生成

此模型为韩语文本生成提供优化支持

dolphin-2.9.4-llama3.1-8b-gguf

dolphin-2.9.4-llama3.1-8b-gguf

Huggingface机器学习

Llama3.1衍生的开放对话模型Dolphin 2.9.4

thainer-corpus-v2-base-model

thainer-corpus-v2-base-model

泰语WangchanBERTa

泰语命名实体识别模型,支持地名、人名等信息的高精度识别

tiny-random-OPTForCausalLM-extended-vocab

tiny-random-OPTForCausalLM-extended-vocab

模型训练Github

轻量级OPT因果语言模型测试框架

telepony-v2testfinal-sdxl

telepony-v2testfinal-sdxl

文生图Github

Stable Diffusion XL驱动的动漫风格马匹生成模型