
适用于多语音任务的自监督预训练模型

基于判别器架构的高效预训练语言模型

WavLM预训练模型声纹识别与说话人验证系统

VideoMAE模型基于自监督学习实现Kinetics-400数据集80.9%分类准确率

Facebook推出革新性语音表示学习模型

采用MAE预训练的Vision Transformer图像特征模型

DINO训练的小型Vision Transformer图像特征模型

基于掩码自编码器的视频自监督预训练模型

面向说话人验证的先进语音模型

大规模日语语音表示学习模型HuBERT

WavLM预训练模型助力高性能说话人分类

多领域预训练的大规模语音识别模型

DINO训练的小型Vision Transformer模型及其应用

Vision Transformer自监督图像特征提取模型

自监督训练的ViT模型实现高效图像特征提取

胸部X光图像自监督编码的视觉转换器模型

DINO训练的ViT模型在图像识别中的应用

无监督大规模视觉特征学习模型

基于wav2vec2的越南语自监督学习模型提升语音识别性能

基于Vision Transformer的大规模自监督视觉特征学习模型
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号