值得探索的AI开源项目:工具、网站与应用合集

GenerSpeech入门学习资料 - 高保真零样本风格迁移TTS模型

GenerSpeech入门学习资料 - 高保真零样本风格迁移TTS模型

GenerSpeech是一个用于域外自定义语音高保真零样本风格迁移的文本转语音模型。本文汇总了GenerSpeech的相关学习资源,包括项目介绍、代码实现、演示样例等,帮助读者快速了解和上手这一前沿TTS技术。

GenerSpeech文本到语音风格转换零样本学习多GPU支持Github开源项目
Tailor入门指南 - 令人惊叹的智能视频编辑工具

Tailor入门指南 - 令人惊叹的智能视频编辑工具

Tailor是一款功能强大的视频智能裁剪、生成和优化工具。本文介绍了Tailor的主要功能、安装方法和使用教程,帮助你快速上手这个令人惊叹的视频编辑神器。

Tailor视频剪辑视频生成视频优化人脸识别Github开源项目
speech-recognition-uk学习资料汇总 - 乌克兰语语音识别与合成项目

speech-recognition-uk学习资料汇总 - 乌克兰语语音识别与合成项目

本文汇总了乌克兰语语音识别与合成项目speech-recognition-uk的相关学习资源,包括模型、数据集、工具等,为有意学习该项目的读者提供全面的参考指南。

语音识别语音合成自动化语音转文本Ukrainian自然语言处理Github开源项目
PortaSpeech入门学习资料汇总 - 便携高质量生成式文本转语音模型

PortaSpeech入门学习资料汇总 - 便携高质量生成式文本转语音模型

本文汇总了PortaSpeech项目的各种学习资源,包括项目介绍、代码仓库、论文、音频样本等,帮助读者快速了解和上手这个便携高质量的生成式TTS模型。

PortaSpeech文本转语音PyTorch实现音频样本模型大小Github开源项目
LangHelper入门学习资料 - 基于ChatGPT和AI模型的强大语言学习应用

LangHelper入门学习资料 - 基于ChatGPT和AI模型的强大语言学习应用

本文汇总了LangHelper项目的相关学习资源,包括项目介绍、功能特性、安装教程、使用说明等,帮助读者快速了解和上手这款强大的语言学习工具。

ChatGPTLangHelper发音评分语音识别AI发音Github开源项目
LiveWhisper入门学习资料 - 基于OpenAI Whisper的实时语音转写工具

LiveWhisper入门学习资料 - 基于OpenAI Whisper的实时语音转写工具

LiveWhisper是一个基于OpenAI Whisper的实时语音转写工具,本文汇总了LiveWhisper项目的学习资料和相关资源,帮助读者快速了解和使用这个开源项目。

LiveWhisperWhisper语音命令助手录音转录语音激活Github开源项目
FunCodec学习资料汇总 - 开源神经语音编解码工具包

FunCodec学习资料汇总 - 开源神经语音编解码工具包

FunCodec是一个用于音频量化和下游应用的开源神经语音编解码工具包,本文汇总了该项目的各类学习资源,包括官方文档、预训练模型、教程等,帮助读者快速入门和深入学习FunCodec。

FunCodec语音编解码神经网络开源工具LibriTTSGithub开源项目
tts-server-go 入门指南 - 微软 TTS 服务转发工具

tts-server-go 入门指南 - 微软 TTS 服务转发工具

本文全面介绍了 tts-server-go 项目,包括其功能、使用方法和相关资源,帮助读者快速了解和使用这个微软 TTS 服务转发工具。

tts-server-go安卓系统稳定版下载本地服务器朗读接口Github开源项目
NTTS入门指南 - 跨平台神经网络文本转语音库

NTTS入门指南 - 跨平台神经网络文本转语音库

NTTS是一个强大的跨平台神经网络文本转语音(TTS)库,可以在没有网络连接的情况下在CPU上生成自然逼真的语音。本文汇总了NTTS的学习资料和相关资源,帮助开发者快速上手使用这个开源项目。

Neural Text To Speechntts_dartAI语音合成无需互联网自然发声Github开源项目
klaam学习资料汇总 - 阿拉伯语语音处理开源工具库

klaam学习资料汇总 - 阿拉伯语语音处理开源工具库

klaam是一个强大的阿拉伯语语音处理开源工具库,提供语音识别、分类和文本转语音功能。本文汇总了klaam的学习资料,帮助读者快速上手这个项目。

klaam语音识别文本转语音wav2vecfastspeech2Github开源项目
GST-Tacotron学习资料汇总 - 端到端语音合成中的无监督风格建模、控制和迁移

GST-Tacotron学习资料汇总 - 端到端语音合成中的无监督风格建模、控制和迁移

GST-Tacotron是一种端到端语音合成系统,通过全局风格令牌(Global Style Tokens)实现对语音风格的无监督建模、控制和迁移。本文汇总了GST-Tacotron的相关学习资料,包括论文、代码实现、示例等,帮助读者快速入门和深入学习该项目。

GST-TacotronPyTorch语音合成多说话人数据集中文支持Github开源项目
Multi-Tacotron-Voice-Cloning学习资料汇总 - 多语言语音克隆的开源实现

Multi-Tacotron-Voice-Cloning学习资料汇总 - 多语言语音克隆的开源实现

Multi-Tacotron-Voice-Cloning是一个基于Tacotron的多语言(俄语-英语)语音克隆开源项目。本文汇总了该项目的核心信息、学习资源和相关链接,帮助读者快速了解和上手这个强大的语音克隆工具。

Multi-Tacotron Voice Cloning语音合成深度学习多语种文本转语音Github开源项目
-Prototype-AIVTuber 入门学习资料 - 基于OpenAI和Live2D的AI虚拟主播项目

-Prototype-AIVTuber 入门学习资料 - 基于OpenAI和Live2D的AI虚拟主播项目

-Prototype-AIVTuber是一个使用OpenAI模型和Live2D角色开发的AI虚拟主播项目。本文汇总了该项目的相关学习资源,包括项目介绍、安装教程、API使用等,帮助想要了解和学习AI虚拟主播开发的读者快速入门。

AI VTuberOpenAILive2DNodeJSVTube Studio APIGithub开源项目
JARVIS-ChatGPT学习资料汇总 - 智能语音助手项目详解

JARVIS-ChatGPT学习资料汇总 - 智能语音助手项目详解

JARVIS-ChatGPT是一个基于OpenAI和IBM Watson API开发的智能语音助手项目,具有多种合成语音功能,包括著名的J.A.R.V.I.S声音。本文汇总了该项目的相关学习资料,帮助读者快速上手这个强大的AI助手系统。

JARVIS-ChatGPT语音助理OpenAIIBM Watson项目动机Github开源项目
Lobe TTS 入门指南 - 高质量可靠的服务器和浏览器 TTS/STT 库

Lobe TTS 入门指南 - 高质量可靠的服务器和浏览器 TTS/STT 库

Lobe TTS 是一个高质量、可靠的 TTS/STT 库,支持服务器端和浏览器端使用。本文介绍了 Lobe TTS 的主要特性、使用方法和相关资源,帮助开发者快速上手这个强大的语音合成工具。

Lobe TTSTTS/STT库服务器端语音生成React组件开源Github开源项目
StyleTTS学习资料汇总 - 自然多样化的文本转语音生成模型

StyleTTS学习资料汇总 - 自然多样化的文本转语音生成模型

StyleTTS是一个基于风格的文本转语音生成模型,能够合成自然多样的语音。本文汇总了StyleTTS的相关学习资源,包括项目介绍、论文、代码、音频样本等,帮助读者快速入门和深入了解这一强大的TTS模型。

StyleTTS文本到语音自然语言处理情感语调语音合成Github开源项目
WaveGrad入门学习资料汇总 - 基于梯度估计的高质量语音合成模型

WaveGrad入门学习资料汇总 - 基于梯度估计的高质量语音合成模型

WaveGrad是Google Brain提出的一种新型声码器模型,通过估计数据密度梯度来生成高质量语音波形。本文汇总了WaveGrad的相关学习资源,帮助读者快速入门这一前沿技术。

WaveGrad声码器高保真生成混合精度并行训练Github开源项目
SummerTTS入门指南 - 独立编译的中英文语音合成项目

SummerTTS入门指南 - 独立编译的中英文语音合成项目

SummerTTS是一个基于C++的独立编译的中文和英文语音合成项目,可以本地运行不需要网络,而且没有额外的依赖,一键编译完成即可用于中文和英文的语音合成。

SummerTTS语音合成C++模型更新独立编译Github开源项目
VITS2学习资料汇总 - 改进单阶段文本转语音的质量和效率

VITS2学习资料汇总 - 改进单阶段文本转语音的质量和效率

VITS2是一种新型的单阶段文本转语音模型,通过对抗学习和架构设计改进了语音质量和合成效率。本文汇总了VITS2的相关学习资料,帮助读者快速了解和学习这一前沿模型。

VITS2文本到语音单阶段模型自然语言处理SK TelecomGithub开源项目
RVC-WebUI 学习资源汇总 - AI语音转换项目一键部署

RVC-WebUI 学习资源汇总 - AI语音转换项目一键部署

RVC-WebUI是一个重建版的Retrieval-based Voice Conversion WebUI项目,可以实现AI语音转换功能。本文汇总了RVC-WebUI的学习资源,帮助你快速上手这个强大的语音克隆工具。

RVC-WebUI语音转换WebUIPythonWindowsGithub开源项目