精选图像分类AI工具和开源项目合集 | 提供多样化选择

deit-small-patch16-224

deit-small-patch16-224

图像分类DeiT

数据高效的图像Transformer模型,用于精炼图像分类

bit-50

bit-50

开源项目模型

大规模增强视觉学习的预训练模型

convnextv2_nano.fcmae_ft_in1k

convnextv2_nano.fcmae_ft_in1k

Github开源项目

基于FCMAE的ConvNeXt-V2高效图像分类与特征提取模型

tf_efficientnet_b5.ns_jft_in1k

tf_efficientnet_b5.ns_jft_in1k

开源项目模型

精准描述EfficientNet的图像分类与特征提取能力

eva02_base_patch14_448.mim_in22k_ft_in22k_in1k

eva02_base_patch14_448.mim_in22k_ft_in22k_in1k

ImageNetGithub

EVA02视觉Transformer的图像分类与特征提取模型

vit_large_patch14_clip_336.openai_ft_in12k_in1k

vit_large_patch14_clip_336.openai_ft_in12k_in1k

图像分类ImageNet-1k

ViT图像分类与特征提取模型

vit_small_patch8_224.dino

vit_small_patch8_224.dino

图像分类模型比较

基于自监督DINO的图像特征提取Transformer

resnet50.ram_in1k

resnet50.ram_in1k

timmAugMix

ResNet50模型在ImageNet-1k上的应用与特征提取

dino-vits8

dino-vits8

Github预训练

采用DINO训练的自监督Vision Transformer模型

twins_svt_large.in1k

twins_svt_large.in1k

timmTwins-SVT

Twins-SVT模型适用于图像分类的创新Transformer架构

wide_resnet101_2.tv_in1k

wide_resnet101_2.tv_in1k

wide_resnet101_2.tv_in1k特征提取

宽残差网络101_2图像分类与特征提取功能

efficientnet_b5.sw_in12k_ft_in1k

efficientnet_b5.sw_in12k_ft_in1k

timm图像分类

EfficientNet-加强版:适用于图像分类与特征提取的高效模型

convnext_nano.in12k_ft_in1k

convnext_nano.in12k_ft_in1k

ConvNeXtGithub

基于ConvNeXt架构的轻量级图像分类模型

vit-base-patch32-384

vit-base-patch32-384

ImageNetGithub

Vision Transformer图像分类模型支持大规模数据训练

resnet10t.c3_in1k

resnet10t.c3_in1k

图像分类Image Embeddings

使用ResNet-T技术的先进图像分类模型

swinv2-base-patch4-window8-256

swinv2-base-patch4-window8-256

Swin Transformer自监督预训练

增强视觉Transformer模型,提供升级的容量与图像分辨率

mobilenetv4_conv_medium.e500_r256_in1k

mobilenetv4_conv_medium.e500_r256_in1k

timm特征提取

MobileNet-V4中档卷积模型:在保持较低参数量的同时提高图像分类效率

tf_efficientnetv2_m.in21k_ft_in1k

tf_efficientnetv2_m.in21k_ft_in1k

Github开源项目

EfficientNetV2的图片识别与特征提取

siglip-base-patch16-256-multilingual

siglip-base-patch16-256-multilingual

图像分类Huggingface

基于Sigmoid损失函数的多语言视觉语言模型

vit

vit

Optimum Habana开源项目

在Habana Gaudi HPU上高效运行ViT模型的配置指南