精选图像分类AI工具和开源项目合集 | 提供多样化选择

rorshark-vit-base

rorshark-vit-base

模型图像分类

ViT架构图像分类模型实现99.23%精度

vit-large-patch32-384

vit-large-patch32-384

模型Github

基于Transformer架构的大规模图像分类模型

Ethnicity_Test_v003

Ethnicity_Test_v003

模型图像分类

AutoTrain训练的多族裔分类模型准确率达79.6%

efficientnet_b3.ra2_in1k

efficientnet_b3.ra2_in1k

模型预训练模型

EfficientNet B3变体:基于RandAugment的ImageNet-1k图像分类模型

ViT-L-16-SigLIP-384

ViT-L-16-SigLIP-384

SigLIP计算机视觉

基于SigLIP的先进视觉语言模型实现零样本图像分类

CLIP-ViT-B-32-laion2B-s34B-b79K

CLIP-ViT-B-32-laion2B-s34B-b79K

CLIP模型

基于LAION-2B数据集训练的CLIP ViT-B/32零样本图像识别模型

BiomedCLIP-PubMedBERT_256-vit_base_patch16_224

BiomedCLIP-PubMedBERT_256-vit_base_patch16_224

模型开源项目

基于PubMedBERT的生物医学视觉语言基础模型

siglip-base-patch16-224

siglip-base-patch16-224

模型计算机视觉

SigLIP改进CLIP模型 实现更高效的零样本图像分类和检索

efficientnet_b0.ra_in1k

efficientnet_b0.ra_in1k

模型神经网络

EfficientNet-B0模型集成RandAugment技术的图像分类应用

CLIP-ViT-H-14-laion2B-s32B-b79K

CLIP-ViT-H-14-laion2B-s32B-b79K

模型开源项目

基于LAION-2B数据集的多功能视觉-语言模型

vit-tiny-patch16-224

vit-tiny-patch16-224

Huggingface图像分类

轻量级ViT模型实现高效图像分类

vit-age-classifier

vit-age-classifier

PyTorch人脸年龄识别

Vision Transformer人脸年龄分类模型

beit-base-patch16-224-pt22k-ft22k

beit-base-patch16-224-pt22k-ft22k

模型BEiT

BEiT 基于Transformer的自监督图像分类模型

resnet18.a1_in1k

resnet18.a1_in1k

模型神经网络

ResNet18图像分类模型 适用于多种计算机视觉任务

siglip-so400m-patch14-384

siglip-so400m-patch14-384

模型WebLI数据集

SigLIP模型应用sigmoid损失函数提升多模态处理能力

vit-base-patch16-224

vit-base-patch16-224

模型神经网络

Vision Transformer图像分类模型在ImageNet数据集上的应用

CLIP-ViT-B-16-laion2B-s34B-b88K

CLIP-ViT-B-16-laion2B-s34B-b88K

CLIP模型

基于LAION-2B数据集训练的CLIP零样本图像分类模型

nsfw_image_detection

nsfw_image_detection

模型图像分类

基于ViT的NSFW图像检测模型

resnet-50

resnet-50

ImageNet卷积神经网络

ResNet v1.5模型及其应用于图像识别

clip-vit-base-patch16

clip-vit-base-patch16

人工智能计算机视觉

OpenAI开发的CLIP模型实现零样本图像分类和跨模态理解