GPU加速AI工具合集:优化性能与效率

heavydb

heavydb

HeavyDB数据库引擎

开源关系型列式数据库引擎 支持CPU和GPU高性能计算

GPUMD

GPUMD

GPUMD分子动力学

GPU加速的分子动力学模拟和机器学习势能开发工具

warp-drive

warp-drive

WarpDrive深度强化学习

GPU驱动的高效多智能体强化学习框架

rl_games

rl_games

RL Games强化学习

强化学习框架支持多环境及算法的高性能实现

models

models

Merlin Models推荐系统

推荐系统深度学习模型库

Harbeth

Harbeth

图像处理Metal

Swift图像处理库 支持GPU加速和实时相机滤镜

libplacebo

libplacebo

libplacebo视频渲染

跨平台GPU加速视频处理开源库

benchmarks

benchmarks

CatBoost基准测试

主流机器学习库全面性能基准测试

SCAMP

SCAMP

SCAMP矩阵剖面

高效矩阵剖面计算框架

contour

contour

Contour终端模拟器

现代化跨平台终端模拟器提供GPU加速和丰富功能

curv

curv

Curv函数表示

函数式编程创造数学艺术的开源语言

tensorflow-directml-plugin

tensorflow-directml-plugin

TensorFlowDirectML

DirectML驱动的TensorFlow硬件加速插件

nnabla-rl

nnabla-rl

nnablaRL深度强化学习

深度强化学习库,基于Neural Network Libraries构建

AITemplate

AITemplate

AITemplate深度神经网络

开源高性能深度学习推理框架

thundersvm

thundersvm

ThunderSVM机器学习

GPU加速的开源支持向量机库

AutoAWQ

AutoAWQ

AutoAWQ量化

面向大型语言模型的高效4位量化框架

cutlass-kernels

cutlass-kernels

CUTLASSFlashAttention-3

针对大语言模型优化的高效CUDA库

diffusers.js

diffusers.js

diffusers.jsAI绘图

JavaScript扩散模型运行库支持GPU和WebGPU

flash-attention-minimal

flash-attention-minimal

Flash AttentionCUDA

简化Flash Attention的CUDA和PyTorch最小化实现

warp

warp

NVIDIA WarpPython框架

用于高性能模拟和图形计算的Python框架