
GAN神经声码器结合切片对抗网络的创新音频生成模型

多领域英语语音识别数据集提供10,000小时转录音频

直线路径优化的快速数据生成与传输技术

创新的潜在扩散Transformer视频生成技术

可扩展插值变换器 融合流模型和扩散模型的图像生成新方法

自回归扩散模型:无向量量化的图像生成方法

创新自回归图像生成方法

音频AI领域2023年重大进展及模型概览

草图应用资源汇总 涵盖多领域前沿技术

将单张肖像图片与音频结合生成逼真的动态说话视频

先进的AI视频口型同步技术

开源音频超分辨率工具 适用多种类型和采样率

PyTorch多模态模型开发框架

AI驱动的音频转人物对话视频技术

语音驱动的端到端面部动画合成模型

将贝叶斯方法与流网络相结合的生成模型新框架

GPU并行计算技术与高性能编程系列讲座

跨框架张量运算统一接口库

Transformer架构重塑目标检测流程

Meta's Encodec音频编解码器的C/C++高性能实现
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号