自监督学习工具汇总：实用AI工具与开源项目一览

hubert-xlarge-ls960-ft

Hubert开源项目

采用大规模LibriSpeech数据集微调的HuBERT模型，展示前沿语音识别性能

convnextv2_large.fcmae

图像分类ConvNeXt-V2

用于图像特征提取的自监督卷积模型

vit_base_patch8_224.dino

Github模型

将自监督DINO方法应用于视觉变换器以增强图像特征提取能力

albert-xxlarge-v1

机器学习Github

大型英文数据集上的预训练语言模型

dinov2-small-imagenet1k-1-layer

DINOv2特征提取

视觉特征学习的Transformer模型

dino-vitb8

Github开源项目

无需微调，实现高效图像分类的自监督视觉转换器

superpoint

Github开源项目

自监督模型SuperPoint提高多视图几何问题的兴趣点检测和描述

vit_giant_patch14_dinov2.lvd142m

自监督学习图像分类

基于Vision Transformer的无监督视觉特征提取模型

albert-xxlarge-v2

掩码语言模型Github

基于大规模预训练的模型，提升英语语言任务表现

vit_small_patch8_224.dino

图像分类模型比较

基于自监督DINO的图像特征提取Transformer

H-optimus-0

开源项目模型

自监督视觉Transformer在病理学与组织学中的应用

dino-vits8

Github预训练

采用DINO训练的自监督Vision Transformer模型

albert-large-v2

开源项目预训练模型

高效低内存占用的英语语言预训练模型

beit_base_patch16_384.in22k_ft_in22k_in1k

图像分类自监督学习

高效的BEiT自监督图像分类与嵌入模型

phikon

自监督学习深度学习

基于ViT的组织病理学自监督学习模型

data2vec-audio-base-960h

自动语音识别语言模型

利用自监督学习提升语音识别效率的开源框架

regnety_320.seer

Github开源项目

RegNetY-32GF模型：自监督学习优化的图像特征提取工具

Llama-3-8B-Instruct-262k

生成式模型Github

增强长距离上下文处理，支持自主助手功能

vit_small_patch14_reg4_dinov2.lvd142m

Github模型

基于自监督学习的视觉Transformer用于图像特征提取和分类

MERT-v1-95M

预训练模型Github

新的音乐理解模型，适应多种任务需求

1 2 3

探索AI的无限可能

访问

AI工具导航精选AI信息

AI云服务特惠

懂AI专属折扣

关注微信公众号

最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

自监督学习工具汇总：实用AI工具与开源项目一览

hubert-xlarge-ls960-ft

convnextv2_large.fcmae

vit_base_patch8_224.dino

albert-xxlarge-v1

dinov2-small-imagenet1k-1-layer

dino-vitb8

superpoint

vit_giant_patch14_dinov2.lvd142m

albert-xxlarge-v2

vit_small_patch8_224.dino

H-optimus-0

dino-vits8

albert-large-v2

beit_base_patch16_384.in22k_ft_in22k_in1k

phikon

data2vec-audio-base-960h

regnety_320.seer

Llama-3-8B-Instruct-262k

vit_small_patch14_reg4_dinov2.lvd142m

MERT-v1-95M

探索AI的无限可能

推荐工具精选

TRAE编程

扣子-AI办公

码上飞

商汤小浣熊

讯飞绘文

讯飞绘镜

iTerms

AI云服务特惠

火山引擎

阿里云

腾讯云

华为云

百度智能云

AWS

关注微信公众号