Person_reID_baseline_pytorch: 强大而友好的行人重识别基线模型

Person_reID_baseline_pytorch是一个基于PyTorch的行人重识别(Person Re-Identification)基线模型实现。该项目自2017年以来一直在不断更新和改进,为行人重识别研究提供了一个简洁而强大的基准。本文将详细介绍这个项目的主要特点、使用方法以及最新进展。

项目特点

Person_reID_baseline_pytorch具有以下几个突出特点:

强大的性能 - 该基线模型在多个顶级会议的论文中得到了应用,如CVPR2019的《Joint Discriminative and Generative Learning for Person Re-identification》。在Market-1501数据集上,仅使用softmax损失就可以达到Rank@1=88.24%, mAP=70.68%的优秀性能。
资源友好 - 通过使用半精度(FP16)训练,该模型只需要2GB的GPU内存就可以运行,非常适合资源受限的情况。
易于使用 - 项目提供了丰富的命令行选项,可以方便地应用多种先进技巧,如随机擦除、线性预热等。对于Re-ID新手,还提供了详细的教程。
功能丰富 - 支持多种主流网络结构(ResNet、DenseNet等)、损失函数(Triplet Loss、Circle Loss等)以及数据增强方法。还提供了模型可视化、多尺度测试等实用功能。

Person ReID Demo

使用方法

环境配置

Person_reID_baseline_pytorch基于PyTorch实现,主要依赖如下:

Python 3.6+
PyTorch 0.3+
GPU内存 >= 6GB
Numpy
timm (用于Swin Transformer)
pretrainedmodels

可以通过以下命令安装依赖:

pip install -r requirements.txt

数据准备

该项目主要在Market-1501数据集上进行测试。可以从官方网站下载,或使用以下命令:

pip install gdown
pip install --upgrade gdown
gdown 0B8-rUzbwVRk0c054eEozWG9COHM

下载后,需要将相同ID的图像放在同一个文件夹中。可以使用项目提供的prepare.py脚本进行处理。

模型训练

使用以下命令进行模型训练:

python train.py --gpu_ids 0 --name ft_ResNet50 --train_all --batchsize 32  --data_dir your_data_path

主要参数说明:

--gpu_ids: 使用的GPU ID
--name: 模型名称
--train_all: 使用所有图像进行训练
--batchsize: batch大小
--data_dir: 训练数据路径

如果要使用随机擦除数据增强,可以添加--erasing_p 0.5参数。

模型测试

使用以下命令进行特征提取和测试:

python test.py --gpu_ids 0 --name ft_ResNet50 --test_dir your_data_path  --batchsize 32 --which_epoch 59

主要参数说明:

--which_epoch: 选择第几个epoch的模型

性能评估

运行evaluate.py脚本可以得到Rank@1、Rank@5、Rank@10和mAP等评估指标。也可以使用evaluate_gpu.py进行更快的GPU评估。

如果需要使用re-ranking后处理,可以运行evaluate_rerank.py。但需要注意,这可能需要超过10GB的内存。

模型性能

在Market-1501数据集上,使用不同的配置可以达到如下性能:

方法	Rank@1	mAP
ResNet-50 (基线)	88.84%	71.59%
ResNet-50 (all tricks)	91.83%	78.32%
ResNet-50 (all tricks+Circle)	92.13%	79.84%
Swin (all tricks+Circle 224x224)	94.12%	84.39%
Swin (all tricks+Circle+b16+DG 224x224)	94.00%	85.36%