efficientnet_b2.ra_in1k

项目介绍：efficientnet_b2.ra_in1k

efficientnet_b2.ra_in1k 是一个基于 EfficientNet 的图像分类模型，专为在 ImageNet-1k 数据集上进行训练。该模型使用了名为 timm 的库，用于图像分类和特征提取，它具有高效的模型缩放能力。

训练方法

efficientnet_b2.ra_in1k 模型的训练基于 RandAugment RA 的配方，这种方法是对 EfficientNet RandAugment 方法的改进，最初在论文《ResNet Strikes Back》中介绍。训练过程中，使用了 RMSProp（TF 1.0 行为）优化器和 EMA 权重平均策略，以及具有预热阶段的指数递减学习率。

模型详情

模型类型: 图像分类/特征主干
模型参数:
- 参数量: 9.1 百万
- GMACs: 0.9
- 激活数量: 12.8 百万
- 图像尺寸: 训练时 256x256，测试时 288x288
相关论文:
- EfficientNet: 重新思考卷积神经网络的模型缩放
- ResNet strikes back: timm 中改进的训练程序
数据集: ImageNet-1k

模型使用

efficientnet_b2.ra_in1k 模型可用于图像分类、特征图提取和图像嵌入，以下是使用方法的简单介绍。

图像分类

通过输入图像获得分类结果，代码示例展示如何载入图像并提取前五个概率最高的类别。

特征图提取

模型可以配置为仅提取特征图，以分析输入图像在不同层特征图的形状和维度。

图像嵌入

提供了一种通过移除分类层来获取图像嵌入特征的方法，这对于下游任务非常有用。

模型比较

用户可以通过 timm 的模型结果查看模型的数据集和运行时指标，以便与其他模型进行比较。

文献引用

在研究或应用中使用本模型时，请引用相关学术文献。

@inproceedings{tan2019efficientnet,
  title={Efficientnet: Rethinking model scaling for convolutional neural networks},
  author={Tan, Mingxing and Le, Quoc},
  booktitle={International conference on machine learning},
  pages={6105--6114},
  year={2019},
  organization={PMLR}
}

@misc{rw2019timm,
  author = {Ross Wightman},
  title = {PyTorch Image Models},
  year = {2019},
  publisher = {GitHub},
  journal = {GitHub repository},
  doi = {10.5281/zenodo.4414861},
  howpublished = {\url{https://github.com/huggingface/pytorch-image-models}}

@inproceedings{wightman2021resnet,
  title={ResNet strikes back: An improved training procedure in timm},
  author={Wightman, Ross and Touvron, Hugo and Jegou, Herve},
  booktitle={NeurIPS 2021 Workshop on ImageNet: Past, Present, and Future}
}