Qualcomm AI Hub Models: 高性能优化的机器学习模型集合

ai-hub-models

Qualcomm AI Hub Models: 赋能边缘 AI 的利器

在人工智能技术蓬勃发展的今天,将 AI 能力带到边缘设备已成为一个重要趋势。作为移动芯片领域的领导者,Qualcomm 公司推出了 Qualcomm AI Hub Models 项目,旨在为开发者提供一系列针对 Qualcomm 设备优化的高性能机器学习模型。这个开源项目为在移动设备等资源受限的环境中部署 AI 应用开辟了新的可能性。

项目概述

Qualcomm AI Hub Models 是一个包含多种先进机器学习模型的集合,这些模型已经针对 Qualcomm 设备进行了性能优化,可以直接部署使用。该项目涵盖了视觉、语音和文本等多个领域的应用,为开发者提供了丰富的选择。

Qualcomm AI Hub Models Logo

该项目的主要特点包括:

提供针对设备部署优化的视觉、语音、文本和生成式 AI 模型
开源模型量化、优化和设备部署的方法
在多种设备上测试的模型性能指标
通过 Hugging Face 平台访问模型
提供模型在设备上部署的示例应用
支持在托管的 Qualcomm 设备上运行这些模型

技术细节

Qualcomm AI Hub Models 支持多种运行时环境,包括 TensorFlow Lite、Qualcomm AI Engine Direct 和 ONNX。这些模型可以部署在 Android、Windows 和 Linux 系统上。在计算单元方面,它支持 CPU、GPU 和 NPU(包括 Hexagon DSP 和 HTP)。

在精度方面,该项目支持 FP16 浮点运算,以及 INT8(8 位权重和激活)和 INT4(4 位权重,16 位激活)的整数量化。这种灵活性使得开发者可以根据具体需求在精度和性能之间做出权衡。

Qualcomm AI Hub Models 支持多种 Snapdragon 芯片组,从 Snapdragon 845 到最新的 Snapdragon 8 Gen 3 和 Snapdragon X Elite 都在支持列表中。这意味着开发者可以在各种高中低端移动设备上部署这些优化模型。

使用方法

开发者可以通过多种方式使用 Qualcomm AI Hub Models:

本地 PyTorch CLI 演示:每个模型都提供了本地运行的 PyTorch CLI 演示,开发者可以快速验证模型功能。
设备上运行的 CLI 演示:部分模型提供了在托管 Qualcomm 设备上运行的 CLI 演示,可以直接测试模型在实际设备上的性能。
Python API:项目提供了 Python API,方便开发者在自己的应用中集成这些模型。
示例应用:项目提供了一些示例应用,展示如何在实际应用中使用这些模型。

Qualcomm AI Hub 工作流程

模型目录

Qualcomm AI Hub Models 项目包含了丰富的模型库,涵盖了多个计算机视觉任务:

图像分类:包括 ConvNext、DenseNet、EfficientNet、GoogLeNet、Inception、MobileNet、ResNet 等系列模型。
图像编辑:如 AOT-GAN、LaMa-Dilated 等模型。
超分辨率:包括 ESRGAN、QuickSRNet、Real-ESRGAN、SESR 等模型。
语义分割:提供了 DeepLabV3、FCN、FFNet、FastSAM、MediaPipe Selfie、SINet、SAM、Unet、YOLOv8-Seg 等多种选择。
目标检测:包括 DETR、SSD、YOLOv5、YOLOv7、YOLOv8 等流行模型。

这些模型大多提供了量化版本,可以进一步提高在资源受限设备上的性能。