适用于多语音任务的自监督预训练模型
基于判别器架构的高效预训练语言模型
WavLM预训练模型声纹识别与说话人验证系统
VideoMAE模型基于自监督学习实现Kinetics-400数据集80.9%分类准确率
Facebook推出革新性语音表示学习模型
采用MAE预训练的Vision Transformer图像特征模型
DINO训练的小型Vision Transformer图像特征模型
基于掩码自编码器的视频自监督预训练模型
面向说话人验证的先进语音模型
大规模日语语音表示学习模型HuBERT
WavLM预训练模型助力高性能说话人分类
多领域预训练的大规模语音识别模型
DINO训练的小型Vision Transformer模型及其应用
Vision Transformer自监督图像特征提取模型
自监督训练的ViT模型实现高效图像特征提取
胸部X光图像自监督编码的视觉转换器模型
DINO训练的ViT模型在图像识别中的应用
无监督大规模视觉特征学习模型
基于wav2vec2的越南语自监督学习模型提升语音识别性能
基于Vision Transformer的大规模自监督视觉特征学习模型
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号