最佳PyTorch工具集合:AI开发者的实用资源

hidet

hidet

Hidet深度学习编译器

用Python编写的开源深度学习编译器,主要优化NVIDIA GPU上的推理任务

accelerate

accelerate

AcceleratePyTorch

简化多设备PyTorch训练的框架

fairscale

fairscale

FairScalePyTorch

强化PyTorch大规模深度学习训练的开源库

autoregressive-diffusion-pytorch

autoregressive-diffusion-pytorch

自回归扩散图像生成

自回归扩散模型:无向量量化的图像生成方法

pyannote-audio

pyannote-audio

pyannote.audio说话人分类

先进的开源语音说话人分离工具包

conditional-flow-matching

conditional-flow-matching

Flow Matching生成模型

连续正规化流模型的高效训练库

attention-gym

attention-gym

Attention GymFlexAttention

FlexAttention API的注意力机制实验工具集

multimodal

multimodal

TorchMultimodal多模态模型

PyTorch多模态模型开发框架

lhotse

lhotse

Lhotse语音处理

Python语音数据处理库 支持灵活高效操作

lectures

lectures

CUDAGPU编程

GPU并行计算技术与高性能编程系列讲座

tensordict

tensordict

TensorDictPyTorch

PyTorch张量集合操作的高效字典类工具

audiocraft

audiocraft

AudioCraft音频生成

Facebook开源的AI音频生成工具库

dasp-pytorch

dasp-pytorch

PyTorch音频处理

基于PyTorch的可微分音频信号处理器库

torchdiffeq

torchdiffeq

PyTorchODE求解器

可微分常微分方程求解器库 PyTorch实现

SpeechMOS

SpeechMOS

SpeechMOS语音质量评估

简化语音质量评估的开源工具

rvc-tts-pipeline

rvc-tts-pipeline

RVC-TTS-Pipeline语音合成

TTS与RVC融合的开源语音合成流水线

whisper-vits-svc

whisper-vits-svc

VITS语音转换

基于VITS的端到端歌声转换开源项目

sherpa

sherpa

语音识别深度学习

基于PyTorch的开源E2E语音识别框架 支持C++和Python

k2

k2

k2有限状态自动机

高性能自动微分FSA/FST算法库 支持语音识别

mmengine

mmengine

MMEnginePyTorch

深度学习训练引擎支持大规模模型训练和多种策略