Olive

Olive

硬件感知型AI模型优化开源工具

Olive是一个开源的硬件感知型AI模型优化工具,整合了先进的模型压缩、优化和编译技术。它能根据特定模型和目标硬件自动选择最适合的优化方法,在保证精度和延迟的同时,为云端和边缘设备生成高效推理模型。Olive通过简化开发流程和统一优化框架,支持多种硬件平台,有效提升AI模型部署效率。

Olive模型优化硬件感知AI加速开源框架Github开源项目

Olive

PyPI 发布 文档

Olive 是一个易于使用的硬件感知模型优化工具,它结合了业界领先的模型压缩、优化和编译技术。给定一个模型和目标硬件,Olive 会组合最合适的优化技术,输出最高效的模型,用于云端或边缘推理,同时考虑准确性和延迟等一系列约束条件。

由于每个 ML 加速器供应商都实现了自己的加速工具链以充分利用其硬件,因此硬件感知优化是分散的。通过 Olive,我们可以:

减少为云端和边缘优化模型的工程工作:开发人员需要学习和使用多个硬件供应商特定的工具链来准备和优化他们的训练模型以进行部署。Olive 旨在通过聚合和自动化所需硬件目标的优化技术来简化这一体验。

构建统一的优化框架:鉴于没有单一的优化技术能够很好地适用于所有场景,Olive 提供了一个可扩展的框架,允许业界轻松插入他们的优化创新。Olive 可以高效地组合和调整集成技术,提供即用型的端到端优化解决方案。

新闻

入门和资源

安装

我们建议在虚拟环境conda 环境中安装 Olive。Olive 使用 pip 安装。

创建所需 Python 版本的虚拟/conda 环境并激活它。

你需要安装 onnxruntime 的构建版本。你可以单独安装所需的构建,但在 Olive 安装过程中也可以将公共版本的 onnxruntime 作为额外依赖项安装。

使用 pip 安装

Olive 可从 PyPI 安装。

pip install olive-ai

安装 onnxruntime(默认 CPU):

pip install olive-ai[cpu]

安装 onnxruntime-gpu:

pip install olive-ai[gpu]

安装 onnxruntime-directml:

pip install olive-ai[directml]

可选依赖项

Olive 有一些可选依赖项,可以安装它们以启用额外功能。请参考 Olive 包配置 了解额外功能及其依赖项列表。

流水线状态

构建状态

构建状态

构建状态

构建状态

贡献

我们非常欢迎您对 Olive 做出贡献。请参阅 CONTRIBUTING.md

许可证

版权所有 (c) Microsoft Corporation。保留所有权利。

根据 MIT 许可证授权。

编辑推荐精选

GPT Image 2中文站

GPT Image 2中文站

AI 图片生成平台

GPT Image 2 是面向用户的 AI 图片生成平台,支持文生图、图生图及多模型创意工作流。

Nano Banana Pro 中文站

Nano Banana Pro 中文站

AI 图片生成工具

输入简单文字,生成想要的图片。支持Nano Banana/gptimage-2等最新模型。

Vecbase

Vecbase

你的AI Agent团队

Vecbase 是专为 AI 团队打造的智能工作空间,将数据管理、模型协作与知识沉淀整合于一处。算法、产品与业务在同一平台无缝协同,让从数据到 AI 应用的落地更快一步。

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

nano-banana纳米香蕉中文站

nano-banana纳米香蕉中文站

国内直接访问,限时3折

输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

下拉加载更多