值得探索的AI开源项目:工具、网站与应用合集

DECtalk入门学习资料 - 经典语音合成技术的现代复兴

DECtalk入门学习资料 - 经典语音合成技术的现代复兴

DECtalk是90年代著名的语音合成技术,本文汇总了DECtalk项目的各种学习资源,帮助读者快速了解和上手这一经典语音合成系统。

DECtalk源代码编译开源Visual StudioGithub开源项目
Maix-Speech学习资料汇总-嵌入式语音AI库

Maix-Speech学习资料汇总-嵌入式语音AI库

Maix-Speech是一个快速、小巧的嵌入式语音AI库,包含ASR、对话、TTS等功能。本文汇总了该项目的相关学习资料,帮助开发者快速上手使用。

Maix-Speech语音识别嵌入式设备TTSASRGithub开源项目
WaveGrad入门学习资料 - 基于梯度估计的高��质量神经网络声码器

WaveGrad入门学习资料 - 基于梯度估计的高质量神经网络声码器

WaveGrad是一种快速、高质量的神经网络声码器,通过估计数据密度的梯度来生成波形。本文汇总了WaveGrad项目的相关学习资料,帮助读者快速入门和深入了解这一创新性的语音合成模型。

WaveGrad神经声码器高质量合成多GPU训练预训练模型Github开源项目
MegaTTS 2 学习资料汇总 - 零样本语音合成的革命性进展

MegaTTS 2 学习资料汇总 - 零样本语音合成的革命性进展

MegaTTS 2是一个能够利用任意长度语音提示进行零样本语音合成的革命性模型。本文汇总了MegaTTS 2的相关学习资料,帮助读者快速了解和上手这一前沿技术。

Megatts2文本到语音Pytorch-lightning数据集准备VQ-GANGithub开源项目
SoniTranslate学习资源汇总 - 强大的视频音频翻译工具

SoniTranslate学习资源汇总 - 强大的视频音频翻译工具

本文汇总了SoniTranslate项目的主要学习资源,包括官方文档、在线演示、安装教程等,帮助读者快速了解和上手这个强大的视频音频翻译工具。

SoniTranslate视频翻译多语言支持Gradio库开源项目Github
midi2voice入门学习资料 - 将MIDI文件转换为歌声合成的强大工具

midi2voice入门学习资料 - 将MIDI文件转换为歌声合成的强大工具

本文汇总了midi2voice项目的学习资源,包括安装使用指南、在线体验、音色列表等,帮助读者快速上手这个将MIDI转换为歌声的开源工具。

midi2voice人工智能唱歌Sinsy音乐合成MIDI文件Github开源项目
ttslearn入门指南 - 基于Python的文本转语音库

ttslearn入门指南 - 基于Python的文本转语音库

ttslearn是一个用于学习和实现日语文本转语音的Python库。本文介绍了ttslearn的主要功能、安装方法、资源链接等入门信息。

ttslearn音声合成Python日本語TTS学習済みモデルGithub开源项目
VoiceFlow-TTS学习资料汇总 - 高效文本转语音模型

VoiceFlow-TTS学习资料汇总 - 高效文本转语音模型

VoiceFlow-TTS是一个基于整流流匹配的高效文本转语音模型。本文汇总了VoiceFlow-TTS的相关学习资料,包括项目介绍、环境配置、数据准备、模型训练和推理等内容,帮助读者快速了解和上手这个开源TTS项目。

VoiceFlow文本转语音Kaldi模型训练数据准备Github开源项目
AI 设备学习资料汇总 - 探索人工智能助手的未来

AI 设备学习资料汇总 - 探索人工智能助手的未来

本文汇总了当前主流 AI 设备的学习资料,包括 Humane AI Pin、Rabbit R1 等,助你快速了解 AI 助手的发展趋势和潜力。

AI设备OpenAI语音输入镜像处理GPT-4Github开源项目
MsEdgeTTS入门学习资料汇总 - 基于Microsoft Edge Read Aloud API的Azure语音服务模块

MsEdgeTTS入门学习资料汇总 - 基于Microsoft Edge Read Aloud API的Azure语音服务模块

本文汇总了MsEdgeTTS项目的重要学习资源,包括官方文档、使用教程、API参考等,帮助开发者快速上手这个简单易用的文本转语音工具。

MsEdgeTTS文本到语音Microsoft EdgeAzure Speech ServiceSSMLGithub开源项目
Expressive-FastSpeech2学习资料汇总 - 非自回归表达式TTS实现

Expressive-FastSpeech2学习资料汇总 - 非自回归表达式TTS实现

Expressive-FastSpeech2是一个基于FastSpeech2的非自回归表达式(情感、对话)文本转语音(TTS)系统的PyTorch实现,支持英语、韩语和其他语言。本文汇总了该项目的相关学习资源,帮助读者快速了解和上手这个强大的TTS框架。

Expressive-FastSpeech2非自回归TTS情感TTS对话TTS多语言支持Github开源项目
awesome-audio-plaza学习资料汇总 - 音频AI技术论文和资源追踪项目

awesome-audio-plaza学习资料汇总 - 音频AI技术论文和资源追踪项目

awesome-audio-plaza是一个持续追踪和收集音频AI领域最新论文和资源的开源项目,涵盖音乐生成、零样本TTS、语音识别、音频生成等多个方向。

音频项目自然语言处理语音合成音乐生成语音识别Github开源项目
ChineseTtsTflite入门指南-安卓离线中文TTS引擎

ChineseTtsTflite入门指南-安卓离线中文TTS引擎

ChineseTtsTflite是一个基于TensorFlow TTS开发的安卓离线中文TTS引擎,用于测试TFLite模型。本文介绍了该项目的主要特点、使用方法及相关资源,帮助开发者快速上手。

TensorFlowTTSTFLite模型文字转拼音离线使用FastSpeechGithub开源项目
mrcp-plugin-with-freeswitch资源学习总结 - FreeSWITCH与UniMRCP Server集成讯飞语音服务入门指南

mrcp-plugin-with-freeswitch资源学习总结 - FreeSWITCH与UniMRCP Server集成讯飞语音服务入门指南

本文总结了如何使用FreeSWITCH与UniMRCP Server集成讯飞开放平台的语音识别和语音合成服务,构建简单的语音呼叫中心系统。包括环境搭建、配置步骤和测试验证等内容,为初学者提供了完整的入门指南。

FreeSWITCHUniMRCP语音识别语音合成讯飞SDKGithub开源项目
DiffGAN-TTS学习资料汇总 - 基于去噪扩散GAN的高保真高效文本转语音模型

DiffGAN-TTS学习资料汇总 - 基于去噪扩散GAN的高保真高效文本转语音模型

DiffGAN-TTS是一个基于去噪扩散生成对抗网络(GANs)的文本转语音(TTS)模型,能够实现高保真度和高效率的语音合成。本文汇总了DiffGAN-TTS的相关学习资料,帮助读者快速了解和学习这一前沿TTS技术。

DiffGAN-TTS文本到语音PyTorch多说话者TTS训练模型Github开源项目
RVC-TTS-WebUI使用指南 - 基于RVC和Edge-TTS的文本转语音Gradio界面

RVC-TTS-WebUI使用指南 - 基于RVC和Edge-TTS的文本转语音Gradio界面

RVC-TTS-WebUI是一个基于RVC模型和Edge-TTS的文本转语音Gradio网页界面,可以轻松实现高质量的语音合成。本文将详细介绍该项目的安装、使用和相关资源,帮助读者快速上手这个强大的TTS工具。

Text-to-SpeechRVCGradio WebUIPython模型安装Github开源项目
voicefixer_main - 语音修复框架学习资料汇总 - 基于神经声码器的通用语音修复方法

voicefixer_main - 语音修复框架学习资料汇总 - 基于神经声码器的通用语音修复方法

VoiceFixer是一个用于通用语音修复的框架,旨在修复严重退化和历史语音。本文汇总了该项目的相关学习资源,包括代码仓库、论文、演示页面等,帮助读者快速了解和上手这一语音处理工具。

VoiceFixer语音恢复训练评估神经声码器Github开源项目
google-tts 学习资源汇总 - 一款强大的文本转语音 Node.js 库

google-tts 学习资源汇总 - 一款强大的文本转语音 Node.js 库

google-tts 是一个用于 Node.js 的 Google 文本转语音(TTS)库,支持多语言、长文本处理等功能。本文汇总了该项目的学习资源,帮助开发者快速上手使用。

google-tts-apiText-To-Speechnode.js音频转换语音合成Github开源项目
hass-edge-tts学习资料汇总 - 基于Microsoft Edge浏览器的免费TTS服务

hass-edge-tts学习资料汇总 - 基于Microsoft Edge浏览器的免费TTS服务

hass-edge-tts是一个基于Microsoft Edge浏览器TTS服务的Home Assistant集成,无需申请app_key即可使用。本文汇总了该项目的安装配置方法、使用教程、支持的语言和语音等学习资料,帮助读者快速上手这个强大的TTS工具。

Microsoft Edge TTSHome Assistant语音合成配置安装Github开源项目
Comprehensive-Transformer-TTS学习资料汇总-非自回归Transformer文本转语音项目

Comprehensive-Transformer-TTS学习资料汇总-非自回归Transformer文本转语音项目

Comprehensive-Transformer-TTS是一个基于非自回归Transformer的文本转语音(TTS)项目,支持多种先进的Transformer模型和有监督/无监督的时长建模。本文汇总了该项目的相关学习资料,帮助读者快速了解和使用这个强大的TTS框架。

TTS非自回归变换器语音合成持续时间建模PyTorchGithub开源项目