自监督学习工具汇总:实用AI工具与开源项目一览

hubert-xlarge-ls960-ft

hubert-xlarge-ls960-ft

Hubert开源项目

采用大规模LibriSpeech数据集微调的HuBERT模型,展示前沿语音识别性能

convnextv2_large.fcmae

convnextv2_large.fcmae

图像分类ConvNeXt-V2

用于图像特征提取的自监督卷积模型

vit_base_patch8_224.dino

vit_base_patch8_224.dino

Github模型

将自监督DINO方法应用于视觉变换器以增强图像特征提取能力

albert-xxlarge-v1

albert-xxlarge-v1

机器学习Github

大型英文数据集上的预训练语言模型

dinov2-small-imagenet1k-1-layer

dinov2-small-imagenet1k-1-layer

DINOv2特征提取

视觉特征学习的Transformer模型

dino-vitb8

dino-vitb8

Github开源项目

无需微调,实现高效图像分类的自监督视觉转换器

superpoint

superpoint

Github开源项目

自监督模型SuperPoint提高多视图几何问题的兴趣点检测和描述

vit_giant_patch14_dinov2.lvd142m

vit_giant_patch14_dinov2.lvd142m

自监督学习图像分类

基于Vision Transformer的无监督视觉特征提取模型

albert-xxlarge-v2

albert-xxlarge-v2

掩码语言模型Github

基于大规模预训练的模型,提升英语语言任务表现

vit_small_patch8_224.dino

vit_small_patch8_224.dino

图像分类模型比较

基于自监督DINO的图像特征提取Transformer

H-optimus-0

H-optimus-0

开源项目模型

自监督视觉Transformer在病理学与组织学中的应用

dino-vits8

dino-vits8

Github预训练

采用DINO训练的自监督Vision Transformer模型

albert-large-v2

albert-large-v2

开源项目预训练模型

高效低内存占用的英语语言预训练模型

beit_base_patch16_384.in22k_ft_in22k_in1k

beit_base_patch16_384.in22k_ft_in22k_in1k

图像分类自监督学习

高效的BEiT自监督图像分类与嵌入模型

phikon

phikon

自监督学习深度学习

基于ViT的组织病理学自监督学习模型

data2vec-audio-base-960h

data2vec-audio-base-960h

自动语音识别语言模型

利用自监督学习提升语音识别效率的开源框架

regnety_320.seer

regnety_320.seer

Github开源项目

RegNetY-32GF模型:自监督学习优化的图像特征提取工具

Llama-3-8B-Instruct-262k

Llama-3-8B-Instruct-262k

生成式模型Github

增强长距离上下文处理,支持自主助手功能

vit_small_patch14_reg4_dinov2.lvd142m

vit_small_patch14_reg4_dinov2.lvd142m

Github模型

基于自监督学习的视觉Transformer用于图像特征提取和分类

MERT-v1-95M

MERT-v1-95M

预训练模型Github

新的音乐理解模型,适应多种任务需求