⚠ 弃用通知
24.01公告:未来的版本中,将逐步从代码库中移除NCHW数据格式特定的优化。这意味着用户需要将NCHW模型转换为NHWC格式,以便从优化中受益。
<br>
<div align="center">
<img src="https://yellow-cdn.veclightyear.com/0a4dffa0/a6091a9f-ee96-42ad-8020-8ef632ba1f24.png"/><br><br>
</div>
计算库 
计算库是一系列为Arm® Cortex®-A、Arm® Neoverse®和Arm® Mali™ GPU架构优化的低级机器学习函数集合。
与其他开源替代方案相比,该库提供更出色的性能,并能立即支持新的Arm®技术,如SVE2。
主要特点:
- 基于宽松的MIT许可证的开源软件
- 提供100多种用于CPU和GPU的机器学习函数
- 多种卷积算法(GeMM、Winograd、FFT、直接和间接GeMM)
- 支持多种数据类型:FP32、FP16、INT8、UINT8、BFLOAT16
- 关键机器学习原语的微架构优化
- 高度可配置的构建选项,实现轻量级二进制文件
- 先进的优化技术,如内核融合、快速数学启用和纹理利用
- 使用OpenCL调谐器和GeMM优化启发式方法进行设备和工作负载特定的调优
<br>
<br>
文档

注意:文档包括参考API、更新日志、构建指南、贡献指南、勘误表等。
<br>
预构建二进制文件
所有二进制文件可以从这里或下方表格下载。
<br>
平台 | 操作系统 | 发布归档(下载) |
---|
树莓派 4 | Linux® 32位 |  |
树莓派 4 | Linux® 64位 |  |
Odroid N2 | Linux® 64位 |  |
HiKey960 | Linux® 64位 |  |
<br>
架构 | 操作系统 | 发布归档(下载) |
---|
armv7 | Linux® |  |
arm64-v8a | Android™ |  |
arm64-v8a | Linux® |  |
<br>
更多预构建二进制文件请参考以下链接:
预构建二进制文件使用以下与安全性/良好编码实践相关的标志生成:
-Wall, -Wextra, -Wformat=2, -Winit-self, -Wstrict-overflow=2, -Wswitch-default, -Woverloaded-virtual, -Wformat-security, -Wctor-dtor-privacy, -Wsign-promo, -Weffc++, -pedantic, -fstack-protector-strong
支持的架构/技术
-
Arm® CPU:
- 使用Arm® Neon™技术的Arm® Cortex®-A处理器系列
- Arm® Neoverse®处理器系列
- 使用Arm® Neon™技术的Armv8-R AArch64架构的Arm® Cortex®-R处理器系列
- 使用Arm® Neon™技术的Arm® Cortex®-X1处理器
-
Arm® Mali™ GPU:
- Arm® Mali™-G处理器系列
- Arm® Mali™-T处理器系列
-
x86
<br>
支持的系统
- Android™
- 裸机
- Linux®
- OpenBSD®
- macOS®
- Tizen™
<br>
## 资源
- [教程:在树莓派上使用Compute Library运行AlexNet](https://community.arm.com/processors/b/blog/posts/running-alexnet-on-raspberry-pi-with-compute-library)
- [Gian Marco关于优化嵌入式深度学习推理软件性能分析的演讲](https://www.embedded-vision.com/platinum-members/arm/embedded-vision-training/videos/pages/may-2019-embedded-vision-summit)
- [Gian Marco在EVS上关于使用Winograd算法优化CNN的演讲](https://www.embedded-vision.com/platinum-members/arm/embedded-vision-training/videos/pages/may-2018-embedded-vision-summit-iodice)
- [Gian Marco关于使用SGEMM和FFT加速深度学习的演讲](https://www.embedded-vision.com/platinum-members/arm/embedded-vision-training/videos/pages/may-2016-embedded-vision-summit-iodice)
<br>
实验性构建
⚠ 重要提示 Bazel和CMake构建是实验性的仅支持CPU的构建,更多详情请参阅文档。
<br>
如何贡献