ModelScan：保护您的机器学习模型免受序列化攻击

ModelScan：为机器学习模型提供全方位安全保护

在人工智能和机器学习日益普及的今天，模型安全已成为不容忽视的重要议题。随着基础模型的兴起，公开的机器学习模型被越来越多地用于进一步训练和微调。这些模型在关键决策和任务关键型应用中发挥着越来越重要的作用。然而，与电子邮件中的PDF文件相比，对模型的安全扫描仍显不足。这种状况亟待改变，而适当的工具则是第一步。

ModelScan Preview

ModelScan：开源的多格式模型扫描工具

ModelScan是由Protect AI公司开发的开源项目，旨在扫描模型以检测是否包含不安全代码。作为业界首个支持多种模型格式的扫描工具，ModelScan目前支持H5、Pickle和SavedModel格式，可为使用PyTorch、TensorFlow、Keras、Sklearn、XGBoost等框架的用户提供保护，未来还将支持更多格式。

为什么需要扫描模型？

模型通常来自自动化流水线或数据科学家的笔记本电脑。无论哪种情况，在使用之前，模型都需要从一台机器转移到另一台机器。将模型保存到磁盘的过程称为序列化。

模型序列化攻击是指在序列化（保存）过程中向模型内容添加恶意代码 - 这是特洛伊木马的现代版本。攻击者通过利用模型的保存和加载过程来实施攻击。当您使用model = torch.load(PATH)加载模型时，PyTorch会打开文件内容并开始运行其中的代码。一旦加载模型，攻击就会立即执行。

模型序列化攻击可能导致以下后果：

凭证盗窃（窃取云凭证以访问环境中的其他系统）
数据盗窃（窃取发送给模型的请求数据）
数据污染（污染模型完成任务后发送的数据）
模型污染（篡改模型本身的结果）

ModelScan如何工作？

如果使用机器学习框架加载模型会自动执行攻击，那么ModelScan如何在不加载恶意代码的情况下检查内容呢？

答案很简单：它像读取字符串一样一次读取文件内容的一个字节，寻找不安全的代码签名。这使得扫描过程非常快速，在大多数情况下只需几秒钟即可完成模型扫描。同时，这种方法也非常安全。

ModelScan将不安全代码分为以下几个等级：

严重（CRITICAL）
高危（HIGH）
中危（MEDIUM）
低危（LOW）

ModelScan Flow Chart

如果检测到问题，应立即联系模型作者以确定原因。在某些情况下，为了便于数据科学家重现结果，可能会在模型中嵌入代码，但这也会增加被攻击的风险。请根据您的工作负载谨慎判断是否适合使用这种方法。

支持的模型和框架

ModelScan目前支持任何Pickle衍生格式以及许多其他格式：

ML库	API	序列化格式	ModelScan支持
PyTorch	torch.save() 和 torch.load()	Pickle	是
TensorFlow	tf.saved_model.save()	Protocol Buffer	是
Keras	keras.models.save(save_format='h5')	HD5 (分层数据格式)	是
	keras.models.save(save_format='keras')	Keras V3 (分层数据格式)	是
经典ML库 (Sklearn, XGBoost等)	pickle.dump(), dill.dump(), joblib.dump(), cloudpickle.dump()	Pickle, Cloudpickle, Dill, Joblib	是