模型训练必备工具推荐:精选AI软件与开源项目

pythia

pythia

Pythia大语言模型

大语言模型训练过程知识演化分析开源项目

CMLM-ZhongJing

CMLM-ZhongJing

CMLM-ZhongJing中医

中医大语言模型结合古今智慧推动医学创新

micro_diffusion

micro_diffusion

diffusion models模型训练

低成本训练大规模扩散模型的开源方案

colpali

colpali

ColPali文档检索

基于视觉语言模型的高效文档检索系统

YOLOv6

YOLOv6

YOLOv6目标检测

高性能目标检测框架支持多场景应用

torchtune

torchtune

torchtunePyTorch

PyTorch原生库助力简化大语言模型开发

Qwen2

Qwen2

Qwen2大语言模型

阿里巴巴推出多语言大规模语言模型 支持128K上下文

SAM-Med2D

SAM-Med2D

SAM-Med2D医学图像分割

医学图像分割新突破 SAM-Med2D模型

OpenFedLLM

OpenFedLLM

联邦学习大语言模型

联邦学习框架助力大型语言模型隐私数据训练

label-studio-ml-backend

label-studio-ml-backend

Label Studio机器学习后端

Label Studio ML Backend 增强数据标注自动化的开源工具

Transformer-from-scratch

Transformer-from-scratch

TransformerLLM

简洁实现Transformer模型的入门教程

litdata

litdata

LitData数据处理

优化数据处理和流式传输工具 提升AI模型训练效率

keras-cv

keras-cv

KerasCV计算机视觉

跨框架模块化计算机视觉工具集

facechain

facechain

FaceChainAI绘图

AI驱动的快速个性化肖像生成框架

DeepSeek-Coder

DeepSeek-Coder

DeepSeek Coder代码生成

支持多种编程语言的高性能开源代码模型

glados-tts

glados-tts

GLaDOS语音合成

开源Portal风格语音合成引擎

friendly-stable-audio-tools

friendly-stable-audio-tools

Stable AudioAI音频生成

改进后的Stable Audio Tools开源框架支持音频生成模型训练和推理

openWakeWord

openWakeWord

openWakeWord唤醒词

高效易用的开源语音唤醒词识别库

big_vision

big_vision

big vision深度学习

基于Jax/Flax的大规模视觉模型训练框架

GPT-SoVITS-Server

GPT-SoVITS-Server

GPT-SoVITS语音克隆

轻量级语音克隆模型部署工具