torch-cam

TorchCAM项目介绍

项目背景

TorchCAM是一个基于PyTorch的工具，旨在帮助用户轻松使用卷积层的类激活机制。对于那些对深度学习模型的可解释性感兴趣的人来说，这个工具是一个非常有用的选择。它通过提供各种Class Activation Mapping（CAM）技术，使用户能够更直观地可视化模型的哪些部分对特定分类结果有贡献。

项目特性

TorchCAM简化了类激活图的生成过程，使用户能够不必进行额外的复杂操作就能获得相应的激活图。这一工具通过封装模型并利用PyTorch的钩子机制，自动获取所有所需的信息，以生成类激活图。

快速使用指南

配置CAM

要开始使用TorchCAM，用户首先需要定义他们的模型，例如使用预训练的ResNet-18模型：

from torchvision.models import resnet18
model = resnet18(pretrained=True).eval()

接下来，通过TorchCAM的接口设置一个CAM提取器，例如SmoothGradCAMpp：

from torchcam.methods import SmoothGradCAMpp
cam_extractor = SmoothGradCAMpp(model)

获取类激活图

一旦设置好CAM提取器，用户可以按照常规方式使用模型进行数据推理，并通过提取器自动获取激活图。

from torchvision.io.image import read_image
from torchvision.transforms.functional import normalize, resize, to_pil_image

# 读取并预处理输入图像
img = read_image("path/to/your/image.png")
input_tensor = normalize(resize(img, (224, 224)) / 255., [0.485, 0.456, 0.406], [0.229, 0.224, 0.225])

with SmoothGradCAMpp(model) as cam_extractor:
  out = model(input_tensor.unsqueeze(0))
  activation_map = cam_extractor(out.squeeze(0).argmax().item(), out)

可视化激活图

用户可以通过将CAM转换为numpy数组并且使用matplotlib进行可视化：

import matplotlib.pyplot as plt

plt.imshow(activation_map[0].squeeze(0).numpy()); plt.axis('off'); plt.tight_layout(); plt.show()

如果希望将激活图覆盖在原图上，也可以使用以下代码：

from torchcam.utils import overlay_mask

result = overlay_mask(to_pil_image(img), to_pil_image(activation_map[0].squeeze(0), mode='F'), alpha=0.5)
plt.imshow(result); plt.axis('off'); plt.tight_layout(); plt.show()