最佳Github AI工具与开源项目集锦

awesome-large-audio-models

awesome-large-audio-models

大型音频模型语音识别

音频AI模型前沿进展与资源汇总

HierSpeechpp

HierSpeechpp

HierSpeech++语音合成

分层变分推理实现高质量零样本语音合成

seamless_communication

seamless_communication

SeamlessAI模型

AI多语言实时表情语音翻译系统

i-Code

i-Code

Project i-Code多模态人工智能

打造集成可组合的多模态人工智能框架

latent-consistency-model

latent-consistency-model

Latent Consistency ModelsAI绘图

高效快速的少步推理图像合成模型

audio-dataset

audio-dataset

音频数据集LAION

LAION音频数据集收集与处理开源计划

resemble-enhance

resemble-enhance

Resemble Enhance语音增强

语音增强工具提升音质消除噪音

Smooth-Diffusion

Smooth-Diffusion

Smooth Diffusion扩散模型

提升扩散模型潜在空间平滑性的新方法

UniPC

UniPC

UniPC扩散模型

统一预测校正框架加速扩散模型采样

unified-io-2

unified-io-2

Unified-IO 2多模态模型

跨模态人工智能的开源新标杆

BigVGAN

BigVGAN

BigVGAN神经声码器

大规模训练的通用神经网络声码器

recurrent-memory-transformer

recurrent-memory-transformer

Recurrent Memory Transformer长文本处理

记忆增强型Transformer为Hugging Face模型提升长序列处理能力

glTF-Sample-Models

glTF-Sample-Models

glTF3D模型

glTF格式3D模型示例库 助力开发与测试

AudioDec

AudioDec

AudioDec神经音频编解码器

流式高保真神经音频编解码开源项目

aksharamukha

aksharamukha

Aksharamukha转写

印度文化圈多脚本转写系统

FModel

FModel

FModel虚幻引擎

虚幻引擎游戏资源探索与分析工具

FastSAM

FastSAM

Fast Segment Anything图像分割

全景分割模型 速度提升50倍且性能可比SAM

Aegis

Aegis

Aegis Authenticator双因素认证

开源Android双因素认证应用

jupyter-book

jupyter-book

Jupyter Book开源工具

将计算材料转化为高质量数字出版物的开源工具

neural-compressor

neural-compressor

模型压缩量化

开源深度学习模型压缩工具库