safetensors

safetensors

安全高效的张量存储格式 支持零拷贝和延迟加载

safetensors是一种新的张量存储格式,旨在安全高效地保存机器学习模型。与pickle相比,它提供了更好的安全性,同时通过零拷贝技术保持高性能。该库支持Python和Rust,提供简单的API用于张量的存储和加载。safetensors支持延迟加载、布局控制和多种数据类型,适用于大规模模型的存储和分发。在加载速度和内存效率方面表现优异,尤其适合分布式环境。

safetensors张量存储文件格式机器学习Hugging FaceGithub开源项目
<p align="center"> <picture> <source media="(prefers-color-scheme: dark)" srcset="https://huggingface.co/datasets/safetensors/assets/raw/main/banner-dark.svg"> <source media="(prefers-color-scheme: light)" srcset="https://yellow-cdn.veclightyear.com/835a84d5/39cb36ec-b159-43a3-88ea-bb7c6b992791.svg"> <img alt="Hugging Face Safetensors 库" src="https://yellow-cdn.veclightyear.com/835a84d5/39cb36ec-b159-43a3-88ea-bb7c6b992791.svg" style="max-width: 100%;"> </picture> <br/> <br/> </p>

Python Pypi 文档 Codecov 下载量

Rust Crates.io 文档 Codecov 依赖状态

safetensors

Safetensors

这个仓库实现了一种新的简单格式,用于安全地存储张量(相对于pickle而言),同时仍然保持快速(零拷贝)。

安装

Pip

你可以通过pip管理器安装safetensors:

pip install safetensors

从源码安装

对于源码,你需要安装Rust

# 安装Rust curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh # 确保它是最新的并使用稳定版本 rustup update git clone https://github.com/huggingface/safetensors cd safetensors/bindings/python pip install setuptools_rust pip install -e .

入门

import torch from safetensors import safe_open from safetensors.torch import save_file tensors = { "weight1": torch.zeros((1024, 1024)), "weight2": torch.zeros((1024, 1024)) } save_file(tensors, "model.safetensors") tensors = {} with safe_open("model.safetensors", framework="pt", device="cpu") as f: for key in f.keys(): tensors[key] = f.get_tensor(key)

Python文档

格式

  • 8字节:N,一个无符号小端64位整数,包含头部的大小
  • N字节:一个表示头部的JSON UTF-8字符串。
    • 头部数据必须以{字符(0x7B)开始。
    • 头部数据可以在末尾用空格(0x20)填充。
    • 头部是一个类似{"TENSOR_NAME": {"dtype": "F16", "shape": [1, 16, 256], "data_offsets": [BEGIN, END]}, "NEXT_TENSOR_NAME": {...}, ...}的字典,
      • data_offsets指向相对于字节缓冲区开始的张量数据位置(即不是文件中的绝对位置), BEGIN是起始偏移量,END是结束后的偏移量(因此总张量字节大小 = END - BEGIN)。
    • 允许使用特殊键__metadata__来包含自由格式的字符串到字符串映射。不允许使用任意JSON,所有值必须是字符串。
  • 文件的其余部分:字节缓冲区。

注意:

  • 不允许重复键。并非所有解析器都可能遵守这一点。
  • 一般来说,JSON的子集由这个库的serde_json隐式决定。任何晦涩的内容可能会在以后被修改,比如表示整数的奇怪方式、换行符和UTF-8字符串中的转义。这只会出于安全考虑而进行。
  • 不检查张量值,特别是NaN和+/-Inf可能存在于文件中。
  • 允许空张量(一个维度为0的张量)。它们不在数据缓冲区中存储任何数据,但在头部中保留大小。从传统张量库(torch、tensorflow、numpy等)的角度来看,它们并不带来太多价值,但被接受,因为它们是有效的张量。
  • 允许0阶张量(形状为[]的张量),它们仅仅是标量。
  • 字节缓冲区需要完全索引,不能包含空洞。这防止了创建多格式文件。
  • 字节序:小端序。
  • 顺序:'C'或行主序。

又一种格式?

这个crate的主要理由是消除在PyTorch中默认使用pickle的需求。 机器学习领域还有其他格式,以及更通用的格式。

让我们看看替代方案,以及为什么这种格式被认为是有趣的。 这是我非常个人且可能有偏见的观点:

格式安全零拷贝懒加载无文件大小限制布局控制灵活性Bfloat16/Fp8
pickle (PyTorch)🗸🗸🗸
H5 (Tensorflow)🗸🗸🗸~~
SavedModel (Tensorflow)🗸🗸🗸🗸
MsgPack (flax)🗸🗸🗸🗸
Protobuf (ONNX)🗸🗸
Cap'n'Proto🗸🗸~🗸🗸~
Arrow??????
Numpy (npy,npz)🗸??🗸
pdparams (Paddle)🗸🗸🗸
SafeTensors🗸🗸🗸🗸🗸🗸
  • 安全:我可以随意下载一个文件并期望不会运行任意代码吗?
  • 零拷贝:读取文件是否需要比原始文件更多的内存?
  • 懒加载:我可以在不加载所有内容的情况下检查文件吗?以及在不扫描整个文件的情况下只加载其中的某些张量(分布式设置)?
  • 布局控制:懒加载不一定足够,因为如果张量信息分散在文件中,即使信息可以懒加载,你可能也需要访问大部分文件来读取可用的张量(导致多次硬盘到内存的复制)。控制布局以保持对单个张量的快速访问很重要。
  • 无文件大小限制:文件大小是否有限制?
  • 灵活性:我可以在格式中保存自定义代码并在以后无需额外代码就能使用吗?(~表示我们可以存储纯张量以外的内容,但不包括自定义代码)
  • Bfloat16/Fp8:该格式是否原生支持bfloat16/fp8(意味着不需要奇怪的变通方法)?这在机器学习领域变得越来越重要。

主要对比

  • Pickle:不安全,可运行任意代码
  • H5:目前似乎不推荐用于TF/Keras。除此之外,看起来实际上是一个很好的选择。存在一些经典的使用后释放问题:https://www.cvedetails.com/vulnerability-list/vendor_id-15991/product_id-35054/Hdfgroup-Hdf5.html。在安全性方面与pickle有很大不同。此外,代码量为21万行,而本库目前仅约400行。
  • SavedModel:特定于Tensorflow(包含TF图信息)。
  • MsgPack:没有布局控制来实现懒加载(在分布式设置中加载特定部分很重要)
  • Protobuf:有2GB的硬性文件大小限制
  • Cap'n'proto:不支持Float16 链接,因此需要使用字节缓冲区的手动包装器。布局控制似乎可行但不简单,因为缓冲区有限制 链接
  • Numpy (npz):不支持bfloat16。容易受到zip炸弹攻击(DOS)。非零拷贝。
  • Arrow:不支持bfloat16

注意事项

  • 零拷贝:在机器学习中,没有真正的零拷贝格式,数据需要从硬盘传输到内存/GPU内存(这需要时间)。在CPU上,如果文件已经在缓存中,那么它可以真正实现零拷贝,而在GPU上没有这样的硬盘缓存,所以总是需要一次复制,但你可以避免在任何给定时间点在CPU上分配所有张量。SafeTensors对于头部不是零拷贝的。选择JSON是相当随意的,但由于反序列化所需时间远小于加载实际张量数据,而且可读性好,我选择了这种方式(而且空间远小于张量数据)。

  • 字节序:小端序。这可以在以后修改,但目前感觉真的没有必要。

  • 顺序:'C'或行主序。这似乎已经成为主流。如果需要,我们可以稍后添加该信息。

  • 步幅:没有步幅,所有张量在序列化之前需要打包。我还没有看到在序列化格式中存储步幅张量有用的情况。

优势

由于我们可以发明一种新格式,我们可以提出额外的优势:

  • 防止DOS攻击:我们可以精心设计格式,使得几乎不可能使用恶意文件对用户进行DOS攻击。目前,对头部大小有100MB的限制,以防止解析极大的JSON。此外,在读取文件时,保证文件中的地址不会以任何方式重叠,这意味着在加载文件时,内存中不应超过文件的大小。

  • 更快的加载:PyTorch似乎是主要机器学习格式中加载最快的。然而,它在CPU上似乎还有一次额外的复制,我们可以通过使用torch.UntypedStorage.from_file来绕过这一点。目前,与pickle相比,这个库的CPU加载时间非常快。GPU加载时间与PyTorch等效或更快。使用torch进行内存映射在CPU上先加载,然后将所有张量移动到GPU,似乎也somehow更快(与torch pickle中的行为类似)。

  • 懒加载:在分布式(多节点或多GPU)设置中,能够在各个模型上只加载部分张量是很好的。对于BLOOM,使用这种格式可以将在8个GPU上加载模型的时间从常规PyTorch权重的10分钟缩短到45秒。这真正加快了在模型上开发时的反馈循环。例如,当改变分布策略时(例如管道并行vs张量并行),你不必有单独的权重副本。

许可证:Apache-2.0

编辑推荐精选

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

聊天机器人AI助手热门AI工具AI对话
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

热门AI工具AI办公办公工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

模型训练热门AI工具内容创作智能问答AI开发讯飞星火大模型多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

AI助手热门AI工具AI创作AI辅助写作讯飞绘文内容运营个性化文章多平台分发
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

下拉加载更多