pytorch-minimize

pytorch-minimize

PyTorch多变量函数优化工具集

pytorch-minimize是PyTorch生态系统中的多变量函数优化工具集。它集成了BFGS、共轭梯度法和牛顿法等多种算法,支持CPU和GPU运算。该库利用自动微分技术计算精确导数,无需手动提供梯度。此外,它还提供约束优化和非线性最小二乘问题的解决方案,为确定性优化任务提供自动梯度计算和GPU加速支持。

PyTorch优化自动微分最小化函数求解Github开源项目

PyTorch 最小化

有关 pytorch-minimize 的最新信息,请查看文档网站:pytorch-minimize.readthedocs.io

Pytorch-minimize 是一个用于在 PyTorch 中最小化多变量函数的工具集合。它深受 SciPy 的 optimize 模块和 MATLAB 的 优化工具箱 的启发。与使用函数导数数值近似的 SciPy 和 MATLAB 不同,pytorch-minimize 使用自动微分在后台无缝计算的真实一阶和二阶导数。支持 CPU 和 CUDA。

作者:Reuben Feinman

简要概览

import torch from torchmin import minimize def rosen(x): return torch.sum(100*(x[..., 1:] - x[..., :-1]**2)**2 + (1 - x[..., :-1])**2) # 初始点 x0 = torch.tensor([1., 8.]) # 从以下方法中选择: # ['bfgs', 'l-bfgs', 'cg', 'newton-cg', 'newton-exact', # 'trust-ncg', 'trust-krylov', 'trust-exact', 'dogleg'] # BFGS result = minimize(rosen, x0, method='bfgs') # 牛顿共轭梯度 result = minimize(rosen, x0, method='newton-cg') # 牛顿精确 result = minimize(rosen, x0, method='newton-exact')

求解器:BFGS、L-BFGS、共轭梯度法(CG)、牛顿共轭梯度法(NCG)、牛顿精确法、狗腿法、信赖域精确法、信赖域 NCG、信赖域 GLTR(Krylov)

示例:查看 Rosenbrock 最小化笔记本,了解使用多种不同算法进行函数最小化的演示。

使用 pip 安装

pip install pytorch-minimize

从源代码安装

git clone https://github.com/rfeinman/pytorch-minimize.git
cd pytorch-minimize
pip install -e .

动机

虽然 PyTorch 提供了许多用于随机优化的例程,但确定性优化的工具却很少;optim 包中只包含 L-BFGS,而且它被修改用于小批量训练。

MATLAB 和 SciPy 是确定性优化的行业标准。这些库有一套全面的例程;然而,它们不支持自动微分。*因此,用户必须提供明确的一阶和二阶梯度(如果已知)或使用有限差分近似。

pytorch-minimize 的动机是提供一套具有自动梯度和 GPU 加速的确定性优化工具。

__

*MATLAB 通过深度学习工具箱提供最小的自动微分支持,但集成并不无缝:数据必须转换为 "dlarray" 结构,并且只支持部分函数。 此外,导数仍然需要构造并作为函数句柄提供。 Pytorch-minimize 使用自动微分在后台计算导数,所以你只需提供一个目标函数。

pytorch-minimize 库包括用于通用函数最小化(无约束和有约束)的求解器,以及用于非线性最小二乘问题的求解器。

1. 无约束最小化器

以下求解器可用于_无约束_最小化:

  • BFGS/L-BFGS:BFGS 是无约束优化的典型拟牛顿方法。我实现了标准 BFGS 和"有限内存"L-BFGS。对于内存不是问题的较小规模问题,BFGS 应该比 L-BFGS 快得多(特别是在 CUDA 上),因为它避免了 Python 循环,而是使用纯 torch。

  • 共轭梯度法(CG)。 共轭梯度算法是线性共轭梯度法在非线性优化问题上的推广。Pytorch-minimize 包含了 Nocedal & Wright (2006) 第 5.2 章描述的 Polak-Ribiére CG 算法的实现。

  • 牛顿共轭梯度法(NCG)。 牛顿-拉夫森方法是无约束优化的基本方法。虽然使用 PyTorch 的反向自动微分计算完整的 Hessian 矩阵成本较高,但计算 Hessian-向量积却很廉价,而且还能节省大量内存。牛顿法的共轭梯度(CG)变体是使用 Hessian-向量积进行无约束最小化的有效解决方案。我实现了一个轻量级的 NewtonCG 最小化器,它使用 HVP 来解决线性逆子问题。

  • 精确牛顿法。 在某些情况下,我们可能更倾向于使用牛顿-拉夫森方法的更精确变体,尽管这会增加额外的复杂性。我还实现了牛顿法的一个"精确"变体,它计算完整的 Hessian 矩阵,并使用 Cholesky 分解来解决线性逆子问题。当 Cholesky 分解失败时(即 Hessian 不是正定的),求解器会根据用户指定选择以下两种方案之一:1)最速下降方向(默认),或 2)使用 LU 分解求解逆 Hessian。

  • 信赖域牛顿共轭梯度法。 描述即将推出。

  • 信赖域牛顿广义 Lanczos(Krylov)法。 描述即将推出。

  • 精确信赖域法。 描述即将推出。

  • Dogleg 法。 描述即将推出。

要访问无约束最小化器接口,请使用以下导入语句:

from torchmin import minimize

使用参数 method 来指定应用上述哪种求解器。

2. 约束最小化器

以下求解器可用于约束最小化:

  • 信赖域约束算法。 Pytorch-minimize 包含一个基于 SciPy 的 'trust-constr' 方法的单一约束最小化例程。该算法通过 "constr" 和 "bounds" 参数接受广义非线性约束和变量边界。对于等式约束问题,它是 Byrd-Omojokun 信赖域 SQP 方法的实现。当施加不等式约束时,使用信赖域内点法。注意:当前的信赖域约束最小化器不是自定义实现,而是 SciPy 的 optimize.minimize 例程的包装器。它在后台使用自动微分来构建雅可比和 Hessian 可调用对象,然后调用 scipy。输入和目标函数应像其他 pytorch-minimize 例程一样使用 torch 张量。支持 CUDA 但不推荐使用;数据将在 GPU/CPU 之间来回移动。

要访问约束最小化器接口,请使用以下导入语句:

from torchmin import minimize_constr

3. 非线性最小二乘法

该库还包括专门用于非线性最小二乘问题的求解器。 这些求解器围绕高斯-牛顿法展开,该方法是针对最小二乘设置而修改的牛顿法。 最小二乘接口可以按以下方式导入:

from torchmin import least_squares

least_squares 函数在很大程度上受到 scipy 的 optimize.least_squares 的启发。 大部分 scipy 代码被直接借鉴(保留所有权利)并从 numpy 移植到 torch。 在新接口中,不需要用户提供雅可比函数,而是在后台使用自动微分计算雅可比向量积。 目前,仅实现了信赖域反射("trf")方法,尚不支持边界约束。

示例

Rosenbrock 最小化教程演示了如何使用 pytorch-minimize 通过各种优化策略找到多变量标量函数的最小值。

此外,SciPy 基准测试提供了 pytorch-minimize 求解器与 scipy.optimize 库中相应求解器的比较。 对于从 scipy 转换过来的人来说,这个脚本将有助于了解当前库的设计。 与 scipy 不同,pytorch-minimize 求解器不需要提供雅可比和 Hessian 函数,也不使用数值近似。

对于约束优化,对抗样本教程演示了如何使用信赖域约束例程在给定扰动范数约束的情况下生成最优对抗扰动。

优化器 API

作为函数式API的替代方案,pytorch-minimize还包含了一个基于torch.optim.Optimizer类的"优化器"API。 要访问优化器类,可以按如下方式导入:

from torchmin import Minimizer

引用本工作

如果您在学术研究中使用了pytorch-minimize,可以按以下方式引用该库:

@misc{Feinman2021,
  author = {Feinman, Reuben},
  title = {Pytorch-minimize: a library for numerical optimization with autograd},
  publisher = {GitHub},
  year = {2021},
  url = {https://github.com/rfeinman/pytorch-minimize},
}

编辑推荐精选

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

下拉加载更多