精选图像分类AI工具和开源项目合集 | 提供多样化选择

mobilevitv2-1.0-imagenet1k-256

mobilevitv2-1.0-imagenet1k-256

图像分类PyTorch

MobileViTv2中的可分离自注意力实现高效图像分类

CLIP-ViT-B-32-roberta-base-laion2B-s12B-b32k

CLIP-ViT-B-32-roberta-base-laion2B-s12B-b32k

OpenCLIP开源项目

零样本图像识别与跨模态检索应用

deit_tiny_patch16_224.fb_in1k

deit_tiny_patch16_224.fb_in1k

ImageNetTransformer

高效数据处理的DeiT图像分类和特征提取模型

inception_next_tiny.sail_in1k

inception_next_tiny.sail_in1k

特征提取开源项目

InceptionNeXt架构的轻量级图像分类模型

vit_large_patch14_dinov2.lvd142m

vit_large_patch14_dinov2.lvd142m

timmDINOv2

基于DINOv2的大规模Vision Transformer视觉特征提取模型

densenet121.ra_in1k

densenet121.ra_in1k

ImageNet图像分类

基于RandAugment优化的DenseNet图像分类预训练模型

siglip-base-patch16-512

siglip-base-patch16-512

Github模型

采用Sigmoid损失函数的开源计算机视觉模型

fastvit_ma36.apple_in1k

fastvit_ma36.apple_in1k

计算机视觉图像分类

Apple开源的高性能混合视觉Transformer图像处理模型

convnext_atto.d2_in1k

convnext_atto.d2_in1k

Ross Wightman特征提取

轻量级ConvNeXt模型,优化图像分类和特征提取

convnextv2_huge.fcmae_ft_in22k_in1k_384

convnextv2_huge.fcmae_ft_in22k_in1k_384

图像分类Huggingface

高级卷积网络用于图像分类与特征提取

convnextv2-tiny-1k-224

convnextv2-tiny-1k-224

Github模型

基于全新框架节点,优化卷积网络的性能

maxvit_base_tf_512.in21k_ft_in1k

maxvit_base_tf_512.in21k_ft_in1k

GithubMaxViT

MaxViT图像分类模型支持多尺寸特征提取和深度学习训练

vit_small_patch14_reg4_dinov2.lvd142m

vit_small_patch14_reg4_dinov2.lvd142m

Github模型

基于自监督学习的视觉Transformer用于图像特征提取和分类

siglip-large-patch16-384

siglip-large-patch16-384

开源项目模型

通过改进的损失函数提升多模态图像和文本的匹配效率

marqo-fashionSigLIP

marqo-fashionSigLIP

Github模型

基于SigLIP的时尚图像搜索模型实现多模态检索精准度提升

CLIP-ViT-g-14-laion2B-s12B-b42K

CLIP-ViT-g-14-laion2B-s12B-b42K

开源项目模型

用于零样本图像分类的先进研究工具

efficientnet_b1.ft_in1k

efficientnet_b1.ft_in1k

Github开源项目

基于ImageNet-1k微调的EfficientNet图像分类模型

CLIP-ViT-B-32-xlm-roberta-base-laion5B-s13B-b90k

CLIP-ViT-B-32-xlm-roberta-base-laion5B-s13B-b90k

LAION-5B多语言性能

具备零样本学习与多语言支持的图像模型

resnet50d.ra2_in1k

resnet50d.ra2_in1k

Github神经网络

基于ResNet-D架构的高效图像分类与特征提取模型

tf_efficientnet_b1.ns_jft_in1k

tf_efficientnet_b1.ns_jft_in1k

Github开源项目

EfficientNet图像分类模型,无监督学习的图像标杆