Logo

#文本转语音

PL-BERT学习资料汇总 - 增强文本转语音韵律的音素级BERT模型

1 个月前
Cover of PL-BERT学习资料汇总 - 增强文本转语音韵律的音素级BERT模型

Tacotron-pytorch学习资料汇总 - 基于PyTorch实现的端到端语音合成模型

1 个月前
Cover of Tacotron-pytorch学习资料汇总 - 基于PyTorch实现的端到端语音合成模型

Talkify入门指南 - 为网站添加语音功能的JavaScript库

1 个月前
Cover of Talkify入门指南 - 为网站添加语音功能的JavaScript库

TeToS - 多语音合成服务统一接口使用指南

1 个月前
Cover of TeToS - 多语音合成服务统一接口使用指南

PortaSpeech入门学习资料汇总 - 便携高质量生成式文本转语音模型

1 个月前
Cover of PortaSpeech入门学习资料汇总 - 便携高质量生成式文本转语音模型

Nix-TTS学习资料汇总 - 轻量级端到端文本转语音模型

1 个月前
Cover of Nix-TTS学习资料汇总 - 轻量级端到端文本转语音模型

VoiceSmith入门指南 - 让语音合成变得简单易用的开源工具

1 个月前
Cover of VoiceSmith入门指南 - 让语音合成变得简单易用的开源工具

FastSpeech2学习指南 - 快速高质量的端到端文本转语音模型

1 个月前
Cover of FastSpeech2学习指南 - 快速高质量的端到端文本转语音模型

VoiceFlow-TTS学习资料汇总 - 高效文本转语音模型

1 个月前
Cover of VoiceFlow-TTS学习资料汇总 - 高效文本转语音模型

klaam学习资料汇总 - 阿拉伯语语音处理开源工具库

1 个月前
Cover of klaam学习资料汇总 - 阿拉伯语语音处理开源工具库

相关项目

Project Cover
GPT-SoVITS
GPT-SoVITS-WebUI是一款功能强大的在线语音转换和文本转语音工具,支持跨语言转换与实时语音合成。项目集成了自动训练集分段、中文语音识别和文本标记等工具,能够帮助初学者轻松创建训练数据集和GPT/SoVITS模型。GPT-SoVITS支持零样本和少样本文本转语音,是音频处理领域的创新应用。
Project Cover
MeloTTS
MeloTTS是由MyShell.ai开发的多语言、多方言文本转语音库,支持包括英语(美国、英国、印度、澳大利亚)、西班牙语、法语、中文(结合英语)、日语和韩语等语种。该库特别适合于CPU实时推断,支持无安装使用,本地安装及自定义数据集训练。加入Discord社区交流,共同探讨与合作。
Project Cover
tortoise
Tortoise TTS 是一款先进的文本转语音软件,专为提供多声音功能和高度真实的语调与韵律设计。该项目支持各种安装方式,包括pip和Docker,并提供了完善的本地安装指南。此外,Tortoise TTS 还在Hugging Face上提供在线演示,用户可体验其强大功能。它使用了自回归解码器和扩散解码器,大幅提升了语音生成的速度和质量。无论是个人用户还是开发者,都可通过详细的使用指南迅速上手和部署。
Project Cover
PaddleSpeech
PaddleSpeech是基于PaddlePaddle平台的开源语音处理工具集,覆盖自动语音识别、文本转语音合成、说话人确认及声音分类等多项功能,提供易于使用、高效和灵活的模型,支持各类语音相关任务。工具集包含全流程服务,支持流式识别与合成系统,为研究和工业应用提供强大支持。
Project Cover
VEED
VEED.IO为全球用户提供高效的文本到语音转换,支持多种语言和真实声音选项,适用于内容制作及广告业务,提升视频生产的效率与质量。
Project Cover
琅琅配音
琅琅配音是一款支持超过30种语言和众多情感风格的AI配音平台。提供免费和会员服务,适用于视频解说、有声书、广告等多种场景。界面简洁易用,功能强大,使制作专业品质的配音内容更为便捷。
Project Cover
Uberduck
Uberduck是一个支持多语言的AI语音合成服务平台,提供文本到语音转换、歌声生成和语音克隆技术。它帮助音乐制作人、内容创作者和营销人员通过AI技术,提升音频内容的创造与编辑能力。
Project Cover
Deepgram Voice AI
Deepgram Voice AI平台,采用最新Nova-2语音识别模型,提供实时、高效和低成本的语音转文字与文字转语音APIs,适用于医疗转录、客户服务与媒体字幕制作等多种场景。
Project Cover
ChatTTS
ChatTTS是为对话场景特别设计的文本到语音模型,支持多种语言和多发言者交互。该模型优化对话基础任务,支持细粒度的韵律特征控制,如笑声、停顿等。通过使用预训练模型,ChatTTS在自然语言合成和表达能力方面均有突破性进展,适用于教育和研究目的。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号