最佳Github AI工具与开源项目集锦

SparseTrack

SparseTrack

SparseTrack多目标跟踪

多目标跟踪新方法:基于伪深度的场景分解技术

deepstream_python_apps

deepstream_python_apps

DeepStream SDKPython绑定

为NVIDIA DeepStream SDK提供Python绑定和丰富的示例应用

detr

detr

DETR目标检测

Transformer架构重塑目标检测流程

segment-anything-2

segment-anything-2

SAM 2图像分割

新一代图像和视频分割基础模型

encodec.cpp

encodec.cpp

Encodec音频编解码

Meta's Encodec音频编解码器的C/C++高性能实现

SciencePlots

SciencePlots

SciencePlotsMatplotlib

专业科学图表样式库 助力学术数据可视化

computer_enhance

computer_enhance

计算机编程性能优化

计算机性能优化编程系列源码

ggml

ggml

ggml机器学习

C语言开发的机器学习张量库 支持多种AI模型推理

al-folio

al-folio

al-folioJekyll主题

为学者打造的响应式Jekyll网站主题

fsdp_qlora

fsdp_qlora

FSDPQLoRA

量化技术实现大型语言模型的高效训练

blink

blink

Blink虚拟机

轻量级跨平台x86-64 Linux程序模拟与调试工具

ThunderKittens

ThunderKittens

ThunderKittensCUDA

高效瓦片原语框架助力深度学习内核开发

BayLing

BayLing

BayLing大语言模型

跨语言对齐与指令遵循的多语言大模型

create-t3-app

create-t3-app

T3 StackNext.js

T3 Stack全栈应用程序快速构建工具

lldbinit

lldbinit

LLDB调试器

强大的LLDB增强脚本让调试更高效直观

vocos

vocos

Vocos神经声码器

基于傅里叶变换的快速神经声码器

mamba

mamba

Mamba状态空间模型

线性时间序列建模的突破性架构

ttts

ttts

TTSVQVAE

创新多语言语音合成技术的突破性进展

audiocraft

audiocraft

AudioCraft音频生成

Facebook开源的AI音频生成工具库

ProphetNet

ProphetNet

自然语言生成ProphetNet

微软自然语言生成研究项目概述