最佳语音合成工具推荐:免费好用的AI语音软件合集

naturalspeech3_facodec

naturalspeech3_facodec

FACodecNaturalSpeech 3

FACodec语音编解码器实现属性分解和零样本语音合成

parler-tts

parler-tts

Parler-TTS文本转语音

轻量级开源TTS模型 支持自定义语音特征

awesome-large-audio-models

awesome-large-audio-models

大型音频模型语音识别

音频AI模型前沿进展与资源汇总

HierSpeechpp

HierSpeechpp

HierSpeech++语音合成

分层变分推理实现高质量零样本语音合成

BigVGAN

BigVGAN

BigVGAN神经声码器

大规模训练的通用神经网络声码器

speech-resynthesis

speech-resynthesis

语音重合成自监督学习

基于离散解耦自监督表示的语音重合成技术

espnet_onnx

espnet_onnx

espnet_onnxONNX

轻量级语音识别和合成库 基于ONNX格式优化

CosyVoice_For_Windows

CosyVoice_For_Windows

CosyVoice语音合成

多语言语音合成工具 支持零样本和跨语言生成

xtts-streaming-server

xtts-streaming-server

XTTS流式服务器

Docker化流式文本转语音服务 支持GPU加速与模型定制

SoundStorm

SoundStorm

SoundStorm音频生成

并行音频生成技术探索的非官方PyTorch实现

FastDiff

FastDiff

FastDiff高保真语音合成

高效生成高保真语音的快速条件扩散模型

nnmnkwii

nnmnkwii

Python库PyTorch

用于快速构建语音合成系统的简易库

MARS5-TTS

MARS5-TTS

MARS5CAMB.AI

新型语音模型应对各种复杂韵律

espeak-ng

espeak-ng

eSpeak NG语音合成

小巧的多语言语音合成器,兼容多个操作系统

sherpa-onnx

sherpa-onnx

Sherpa语音识别

多平台本地运行的语音处理开源项目

speech_dataset

speech_dataset

语音识别语音合成

多语言语音识别与合成数据集详细介绍及应用

PL-BERT

PL-BERT

PL-BERT文本转语音

通过PL-BERT实现更自然的语音合成

xtts2-ui

xtts2-ui

XTTS-2-UI文本语音克隆

多语言支持的文字转语音克隆工具

One-Shot-Voice-Cloning

One-Shot-Voice-Cloning

Unet-TTS一键语音克隆

一站式语音克隆与风格转换技术

FCH-TTS

FCH-TTS

ParallelTTS语音合成

并行语音合成模型