convnext_small.fb_in22k

项目介绍：ConvNeXt Small 图像分类模型

ConvNeXt Small 是一个用于图像分类的先进模型，预训练于ImageNet-22k数据集，由相关论文的作者所开发。该模型利用了现代卷积神经网络技术，旨在实现更高的图像识别准确率。

模型详情

ConvNeXt Small 属于图像分类与特征提取的中间体模型，其主要特点和参数包括：

模型类型: 图像分类与特征提取
参数量: 66.3百万
GMACs（Giga Multiply-Accumulate Operations）: 8.7
激活量: 21.6百万
输入图像尺寸: 224 x 224

模型的设计灵感来源于2020年代的卷积神经网络创新技术。我们可以通过访问该模型的原始GitHub项目了解更多技术细节。

数据集

该模型在ImageNet-22k数据集上进行了预训练，ImageNet-22k是一个包含大量高质量标签图像的数据集，广泛应用于计算机视觉领域的训练和测试。

模型使用

ConvNeXt Small 提供了多种应用场景，用户可以根据需要选择合适的使用方式：

图像分类

使用Python库timm，用户可以通过加载预训练的ConvNeXt Small模型来进行图像分类。简单的预处理步骤能将图像转换为模型可识别的格式，随后通过模型输出预测结果。例如，用户可以通过如下代码实现图像分类：

from urllib.request import urlopen
from PIL import Image
import timm

img = Image.open(urlopen('https://example.com/image.png'))
model = timm.create_model('convnext_small.fb_in22k', pretrained=True)
model = model.eval()

data_config = timm.data.resolve_model_data_config(model)
transforms = timm.data.create_transform(**data_config, is_training=False)
output = model(transforms(img).unsqueeze(0))

特征图提取

模型还支持特征图提取，用户可以获取中间层的特征图像，便于对模型进行更深层次的理解和分析。代码示例如下：

model = timm.create_model('convnext_small.fb_in22k', pretrained=True, features_only=True)
model = model.eval()
output = model(transforms(img).unsqueeze(0))
for o in output:
    print(o.shape)

图像嵌入

图像嵌入是另一重要应用场景，用户可以得到图像的嵌入向量用于相似度比较等任务。模型结构支持去除分类层以仅提取特征嵌入：

model = timm.create_model('convnext_small.fb_in22k', pretrained=True, num_classes=0)
model = model.eval()
output = model(transforms(img).unsqueeze(0))