
高效瓦片原语框架助力深度学习内核开发

基于傅里叶变换的快速神经声码器

线性时间序列建模的突破性架构

Facebook开源的AI音频生成工具库

基于PyTorch的可微分音频信号处理器库

改进后的Stable Audio Tools开源框架支持音频生成模型训练和推理

可微分常微分方程求解器库 PyTorch实现

NaturalSpeech 2在PyTorch中的开源实现

先进的多语言文本转语音库 支持1100 多种语言

基于VITS的端到端歌声转换开源项目

扩散模型与Transformer融合的前沿研究进展汇总

多语言文本分割工具 支持85种语言的高效句子和段落分割

基于PyTorch的开源E2E语音识别框架 支持C++和Python

深度学习训练引擎支持大规模模型训练和多种策略

OpenMMLab开源计算机视觉基础库

高效快速的少步推理图像合成模型

跨模态人工智能的开源新标杆

大规模训练的通用神经网络声码器

全景分割模型 速度提升50倍且性能可比SAM

基于RWKV架构的高效视觉感知模型
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号