最佳Github AI工具与开源项目集锦

CosyVoice_For_Windows

CosyVoice_For_Windows

CosyVoice语音合成

多语言语音合成工具 支持零样本和跨语言生成

webui

webui

WebUIGUI开发

轻量级跨平台GUI库 利用浏览器构建应用界面

chatgpt-web-midjourney-proxy

chatgpt-web-midjourney-proxy

ChatGPTMidjourney

整合ChatGPT、Midjourney等多种AI技术的创作平台

cpython

cpython

Python版本更新

Python编程语言的官方实现和解释器

leon-cli

leon-cli

Leon CLI个人助理

简化开源个人助手Leon的安装与使用的命令行工具

Retrieval-based-Voice-Conversion-WebUI

Retrieval-based-Voice-Conversion-WebUI

变声语音转换

开源AI变声框架 实现实时变声和快速模型训练

JetMoE

JetMoE

JetMoE大语言模型

低成本高性能的开源AI语言模型

FastChat

FastChat

FastChat大语言模型

大语言模型聊天机器人开源训练与部署平台

Mangio-RVC-Fork

Mangio-RVC-Fork

RVC语音转换

开源语音转换框架 支持多种F0算法和快速训练

USLM

USLM

USLM语音语言模型

语音信息分层建模与零样本文本转语音的统一框架

SpeechTokenizer

SpeechTokenizer

SpeechTokenizer语音标记器

将语音标记化统一的开源工具

pesto

pesto

PESTO音高估计

基于机器学习的高效音高估计开源工具

xtts-streaming-server

xtts-streaming-server

XTTS流式服务器

Docker化流式文本转语音服务 支持GPU加速与模型定制

react-native

react-native

React Native移动应用开发

React Native 跨平台移动应用开发 高效构建iOS和Android应用

tag-security

tag-security

CNCF云原生安全

CNCF安全技术顾问组推动云原生生态安全创新

sound_dataset_tools2

sound_dataset_tools2

sound_dataset_tools2语音数据集

多功能语音数据集制作工具

Trainer

Trainer

TrainerPyTorch

基于PyTorch的通用模型训练框架

SoundStorm

SoundStorm

SoundStorm音频生成

并行音频生成技术探索的非官方PyTorch实现

ZoomVideoComposer

ZoomVideoComposer

ZoomVideoComposerAI绘图

将AI生成图像序列合成为变焦视频的Python工具

chinese_speech_pretrain

chinese_speech_pretrain

语音预训练模型中文语音识别

中文语音预训练模型,wav2vec 2.0和HuBERT的开源实现