值得探索的AI开源项目:工具、网站与应用合集

Text2Video入门学习资料 - 让文本-图像扩散模型成为零样本视频生成器

Text2Video入门学习资料 - 让文本-图像扩散模型成为零样本视频生成器

本文汇总了Text2Video项目的相关学习资源,包括项目介绍、代码仓库、论文等,帮助读者快速了解和上手这个将文本转换为视频的AI工具。

Text2Video视频合成深度学习生成对抗网络语音合成Github开源项目
dsnote 学习资料汇总 - 离线语音识别、文本转语音和机器翻译工具

dsnote 学习资料汇总 - 离线语音识别、文本转语音和机器翻译工具

本文汇总了 dsnote 项目的相关学习资源,包括项目介绍、安装方法、支持语言、构建指南等,帮助读者快速了解和使用这款强大的开源语音工具。

Speech Note语音识别语音合成机器翻译数据隐私Github开源项目
自制智能音箱完全指南 - 从零开始打造属于自己的智能语音助手

自制智能音箱完全指南 - 从零开始打造属于自己的智能语音助手

本文汇总了自制智能音箱所需的各种开源资源和技术,包括语音唤醒、语音识别、自然语言处理、文本转语音等核心模块,以及主流开源语音助手项目,帮助读者快速入门智能音箱的DIY制作。

智能扬声器语音识别开源项目语音助手语音处理Github
Mandarin-TTS学习资料汇总 - 开源中文语音合成项目

Mandarin-TTS学习资料汇总 - 开源中文语音合成项目

Mandarin-TTS是一个基于PyTorch实现的开源中文语音合成项目,支持多说话人合成、FastSpeech2模型、多种声码器,并提供了预训练模型和详细文档。本文汇总了该项目的学习资源,帮助读者快速上手。

mandarin-tts语音合成vocoderAI绘图githubGithub开源项目
Facemoji入门学习资料 - 一款可以模仿你表情的语音聊天机器人

Facemoji入门学习资料 - 一款可以模仿你表情的语音聊天机器人

Facemoji是一个基于Unity的Android项目,结合了面部表情识别和AI语音聊天功能。本文汇总了Facemoji的相关学习资源,帮助你快速入门这个有趣的开源项目。

FacemojiAIUnity项目表情追踪语音聊天Github开源项目
Neural-Voice-Cloning-With-Few-Samples学习资料汇总 - 使用少量样本进行神经网络语音克隆

Neural-Voice-Cloning-With-Few-Samples学习资料汇总 - 使用少量样本进行神经网络语音克隆

本文汇总了Neural-Voice-Cloning-With-Few-Samples项目的相关学习资料,包括项目介绍、代码实现、论文解读等,旨在帮助读者快速了解和学习这一前沿语音克隆技术。

声音克隆多说话者生成模型NVIDIA V100VCTK数据集训练Github开源项目
JARVIS入门学习资料 - 打造个人智能语音助手

JARVIS入门学习资料 - 打造个人智能语音助手

本文汇总了JARVIS项目的相关学习资源,帮助读者快速入门这个基于语音识别、自然语言处理和语音合成技术的个人智能助手系统。

JARVIS语音助手OpenAI GPT-3PythonWeb接口Github开源项目
epub2tts入门学习资料汇总-将EPUB电子书转换为有声读物的开源工具

epub2tts入门学习资料汇总-将EPUB电子书转换为有声读物的开源工具

epub2tts是一款强大的开源工具,可将EPUB电子书或文本文件转换为高质量的有声读物。本文汇总了该项目的主要功能、使用方法、安装指南等学习资料,帮助读者快速上手使用epub2tts。

epub2tts文本转语音Coqui AI TTS免费开源音频书Github开源项目
alan-sdk-pcf入门指南 - 为Microsoft Power Apps添加AI语音和文本交互功能

alan-sdk-pcf入门指南 - 为Microsoft Power Apps添加AI语音和文本交互功能

alan-sdk-pcf是一个用于Microsoft Power Apps的会话式AI SDK,可以为应用添加语音和文本交互功能。本文介绍了alan-sdk-pcf的主要特性、使用方法以及相关学习资源。

Alan AIAI代理对话体验Alan SDK语音命令Github开源项目
mimic-recording-studio入门指南 - 简化语音训练数据收集的Docker应用

mimic-recording-studio入门指南 - 简化语音训练数据收集的Docker应用

Mimic Recording Studio是一个基于Docker的应用程序,可以简化语音训练数据的收集过程,用于生成Mimic2 TTS语音。

Mimic Recording StudioMycroftText-to-Speech音频记录DockerGithub开源项目
parrots入门学习资料 - 开箱即用的语音识别与合成工具包

parrots入门学习资料 - 开箱即用的语音识别与合成工具包

parrots是一个支持中英文的语音识别(ASR)和语音合成(TTS)工具包,本文汇总了parrots的相关学习资源,帮助开发者快速上手这个强大的语音处理库。

Parrots语音识别语音合成自动化多语言支持Github开源项目
Thorsten-Voice学习资料汇总 - 免费高质量德语TTS语音合成项目

Thorsten-Voice学习资料汇总 - 免费高质量德语TTS语音合成项目

Thorsten-Voice是一个免费、离线、高质量的德语TTS语音合成项目。本文汇总了Thorsten-Voice的学习资料,包括官网、GitHub、数据集、模型等,方便读者快速入门和深入学习这个开源语音合成项目。

Thorsten-Voice语音数据集德语TTS开源语音技术Github开源项目
vits2_pytorch学习资料汇总 - 非官方PyTorch实现的VITS2文本转语音模型

vits2_pytorch学习资料汇总 - 非官方PyTorch实现的VITS2文本转语音模型

本文汇总了vits2_pytorch项目的学习资料,包括项目介绍、预训练模型、示例音频、使用教程等,帮助读者快速了解和上手这个优秀的开源TTS模型。

VITS2文本转语音单阶段模型对抗学习架构设计Github开源项目
xtts-webui学习资料汇总 - 简便易用的XTTS语音合成Web界面

xtts-webui学习资料汇总 - 简便易用的XTTS语音合成Web界面

xtts-webui是一个强大的XTTS语音合成Web界面,本文汇总了该项目的学习资料,包括安装教程、使用指南、相关资源等,帮助用户快速入门和深入使用这一工具。

XTTS-WebUI模型微调语音合成神经网络便携版本Github开源项目
KAN-TTS入门指南 - 一个强大的语音合成训练框架

KAN-TTS入门指南 - 一个强大的语音合成训练框架

KAN-TTS是一个功能强大的语音合成训练框架,本文汇总了KAN-TTS的相关学习资源,帮助开发者快速入门和使用这个框架。

KAN-TTS模型语言支持文本转语音ModelScopeGithub开源项目
alan-sdk-reactnative入门学习资料-React Native语音AI开发SDK

alan-sdk-reactnative入门学习资料-React Native语音AI开发SDK

Alan AI SDK for React Native是一个用于为React Native应用添加语音交互功能的开发工具包。本文汇总了alan-sdk-reactnative的学习资源,包括官方文档、示例代码、教程等,帮助开发者快速上手使用该SDK开发语音AI应用。

Alan AIReact NativeAI代理语音命令对话经验Github开源项目
Android Speech使用指南 - 简化语音识别与文字转语音

Android Speech使用指南 - 简化语音识别与文字转语音

Android Speech是一个强大的开源库,旨在简化Android应用中语音识别和文字转语音功能的实现。本文介绍了该库的主要功能、使用方法和配置选项,帮助开发者快速集成语音功能。

Android Speech语音识别文本转语音Speech.initGradleGithub开源项目
TikTok Voice 学习资料汇总 - 使用 TikTok TTS API 的简单 Python 脚本

TikTok Voice 学习资料汇总 - 使用 TikTok TTS API 的简单 Python 脚本

TikTok Voice 是一个使用 TikTok 文本转语音 API 的 Python 脚本项目。本文汇总了该项目的主要功能、使用方法和相关学习资源,帮助读者快速了解和上手使用 TikTok Voice。

TikTok Text-to-speech APIPythonMP3转换语音选项API接入Github开源项目
Bert-VITS2-ext学习资料汇总 - 基于Bert-VITS2的表情动画生成项目

Bert-VITS2-ext学习资料汇总 - 基于Bert-VITS2的表情动画生成项目

Bert-VITS2-ext是一个基于Bert-VITS2的开源项目,旨在拓展TTS的边界,实现语音合成的同时生成同步的脸部表情和身体动画。本文汇总了该项目的相关学习资源和使用指南。

Bert-VITS2TTS表情生成音频质量数据预处理Github开源项目
Tacotron 入门学习资料 - 端到端语音合成模型简介

Tacotron 入门学习资料 - 端到端语音合成模型简介

Tacotron 是 Google 开发的端到端语音合成模型,本文汇总了 Tacotron 相关的学习资源,包括论文、代码实现、音频样本等,帮助读者快速入门这一前沿语音合成技术。

Tacotron语音合成GoogleSound UnderstandingBrain teamsGithub开源项目