值得探索的AI开源项目:工具、网站与应用合集

MouseTooltipTranslator - 实用的浏览器翻译扩展使用指南

MouseTooltipTranslator - 实用的浏览器翻译扩展使用指南

MouseTooltipTranslator是一款功能强大的Chrome浏览器翻译扩展,支持鼠标悬停即时翻译、PDF文档翻译、YouTube双语字幕等多项实用功能。本文将详细介绍该扩展的主要特性及使用方法,帮助你更好地利用这一工具提升外语学习和阅读效率。

MouseTooltipTranslatorChrome扩展翻译工具PDF支持双字幕Github开源项目
TTS-Voice-Wizard 学习资料汇总 - 免费开源的语音转文字和文字转语音应用

TTS-Voice-Wizard 学习资料汇总 - 免费开源的语音转文字和文字转语音应用

TTS-Voice-Wizard 是一款功能强大的语音转文字和文字转语音应用,专为 VRChat、VTuber 和直播主设计。本文汇总了该项目的各种学习资源,帮助大家快速上手使用。

TTS-Voice-Wizard语音识别文字转语音虚拟现实多语言翻译Github开源项目
StreamSpeech入门学习资料 - "全能"语音识别、翻译与合成模型

StreamSpeech入门学习资料 - "全能"语音识别、翻译与合成模型

StreamSpeech是一个"All in One"的无缝模型,可同时进行离线和实时的语音识别、语音翻译和语音合成。本文汇总了StreamSpeech项目的各种学习资源,帮助读者快速入门这个强大的语音处理模型。

StreamSpeech语音识别语音翻译多任务学习实时合成Github开源项目
NISQA学习资料汇总 - 深�度学习模型预测语音质量和自然度

NISQA学习资料汇总 - 深度学习模型预测语音质量和自然度

NISQA是一个用于预测语音质量和合成语音自然度的深度学习模型。本文汇总了NISQA的相关学习资料,包括项目介绍、安装使用、数据集、论文等,为想要了解和使用NISQA的研究者提供全面的参考。

NISQA语音质量预测训练自然语言合成语音样本Github开源项目
Matcha-TTS学习资料汇总 - 快速非自回归神经网络TTS架构

Matcha-TTS学习资料汇总 - 快速非自回归神经网络TTS架构

Matcha-TTS是一种新的非自回归神经网络TTS方法,使用条件流匹配来加速基于ODE的语音合成。本文汇总了Matcha-TTS的相关学习资源,包括项目介绍、安装使用、模型训练等方面的信息。

Matcha-TTS非自回归神经TTS音频合成试用预训练模型Github开源项目
flutter_tts入门指南 - 跨平台文本转语音Flutter插件

flutter_tts入门指南 - 跨平台文本转语音Flutter插件

flutter_tts是一个功能强大的Flutter文本转语音插件,支持Android、iOS、Web、Windows和macOS等多个平台。本文将全面介绍flutter_tts的使用方法、主要特性和学习资源,帮助开发者快速掌握这一实用工具。

flutter_tts文本转语音插件安卓iOSGithub开源项目
Amica学习资料汇总 - 开源3D人工智能交互界面项目

Amica学习资料汇总 - 开源3D人工智能交互界面项目

Amica是一个开源的3D人工智能交互界面项目,支持语音合成和语音识别。本文汇总了Amica项目的相关学习资料和资源,帮助读者快速了解和上手这个有趣的AI项目。

Amica人工智能3D字符实时交流技术栈Github开源项目
Transformer-TTS入门指南 - 基于Transformer的神经网络语音合成实现

Transformer-TTS入门指南 - 基于Transformer的神经网络语音合成实现

Transformer-TTS是一个基于Transformer网络实现的神经语音合成系统,本文介绍了该项目的基本原理、主要特点和使用方法,帮助读者快速入门这一强大的语音合成工具。

Transformer-TTS语音合成神经网络PyTorchTacotronGithub开源项目
Automatic-Youtube-Reddit-Text-To-Speech-Video-Generator-and-Uploader学习资料汇总 - 自动化生成Reddit内容YouTube视频的开源项目

Automatic-Youtube-Reddit-Text-To-Speech-Video-Generator-and-Uploader学习资料汇总 - 自动化生成Reddit内容YouTube视频的开源项目

一个可以自动从Reddit抓取内容,生成文字转语音视频并上传到YouTube的开源项目。本文汇总了该项目的相关学习资源,包括项目介绍、使用教程、源码分析等。

YouTube Bot自动化视频生成Reddit文本转语音API 使用额度Github开源项目
MelGAN入门学习资料 - 基于GAN的声码器模型

MelGAN入门学习资料 - 基于GAN的声码器模型

MelGAN是一种基于生成对抗网络的声码器模型,可以将梅尔频谱图转换为原始音频波形。本文汇总了MelGAN的相关学习资源,包括论文、代码实现、教程等,帮助读者快速上手这一强大的语音合成模型。

MelGANPyTorch人工智能语音合成预训练模型音频处理Github开源项目
comfyui-mixlab-nodes入门学习资料 - 将工作流转换为APP的强大扩展

comfyui-mixlab-nodes入门学习资料 - 将工作流转换为APP的强大扩展

comfyui-mixlab-nodes是一个功能丰富的ComfyUI扩展,可以将工作流转换为Web应用,支持语音识别、3D模型加载等多种新功能。本文汇总了该项目的重要学习资源,帮助读者快速上手使用。

comfyui-mixlab-nodesSiliconflowLLMChatGPTLLMWeb APPGithub开源项目
Glow-TTS学习资料汇总 - 基于单调对齐搜索的生成式文本转语音模型

Glow-TTS学习资料汇总 - 基于单调对齐搜索的生成式文本转语音模型

Glow-TTS是一个基于归一化流的文本转语音模型,通过单调对齐搜索实现并行生成,无需外部对齐器,具有快速、多样和可控的语音合成能力。

Glow-TTS文本转语音并行合成HiFi-GAN模型训练Github开源项目
DiffWave学习资源汇总 - 快速高质量的神经声码器与波形合成器

DiffWave学习资源汇总 - 快速高质量的神经声码器与波形合成器

DiffWave是一个基于扩散概率模型的多功能波形生成工具,能够进行条件和非条件音频合成。本文汇总了DiffWave的相关学习资源,帮助读者快速了解和上手这一强大的音频生成模型。

DiffWave语音合成神经声码器波形合成器预训练模型Github开源项目
vits-simple-api入门指南 - 一个简单的VITS HTTP API项目

vits-simple-api入门指南 - 一个简单的VITS HTTP API项目

本文全面介绍了vits-simple-api项目,包括其功能特点、部署方法、模型加载、API使用等内容,为想要使用该项目进行语音合成的开发者提供了详细的入门指南。

vits-simple-api人工智能文本转语音GPU加速多模型支持Github开源项目
Irene-Voice-Assistant学习资料汇总 - 离线运行的俄语语音助手

Irene-Voice-Assistant学习资料汇总 - 离线运行的俄语语音助手

Irene是一款支持离线运行的俄语语音助手,通过插件系统实现各种技能。本文汇总了Irene-Voice-Assistant项目的相关学习资料,帮助读者快速了解和上手这个开源语音助手项目。

Иринаголосовой ассистентPythonплагиныустановкаGithub开源项目
Athena入门学习资料 - 开源端到端语音处理引擎

Athena入门学习资料 - 开源端到端语音处理引擎

Athena是一个开源的端到端语音处理引擎,本文汇总了Athena的相关学习资源,帮助大家快速入门和使用这个强大的语音处理工具。

Athena语音处理自动语音识别语音合成端到端模型Github开源项目
ms-ra-forwarder学习资料汇总-免费在线文本转语音API

ms-ra-forwarder学习资料汇总-免费在线文本转语音API

ms-ra-forwarder是一个免费的在线文本转语音API,本文汇总了该项目的相关学习资料和使用指南,帮助读者快速上手这个强大的TTS工具。

Docker部署VercelRailwayHerokuGithub开源项目
MTrans入门指南 - 多源机器翻译API聚合工具

MTrans入门指南 - 多源机器翻译API聚合工具

MTrans是一个开源的多源机器翻译API聚合工具,支持多个主流在线翻译和TTS服务,为开发者提供便捷的翻译和语音合成功能。

MTrans在线翻译TTS免费开源多语种支持Github开源项目
Multilingual_Text_to_Speech学习资料汇总 - 支持多语言实验的Tacotron 2�实现

Multilingual_Text_to_Speech学习资料汇总 - 支持多语言实验的Tacotron 2实现

本文汇总了Multilingual_Text_to_Speech项目的各种学习资源,包括GitHub仓库、论文、演示和数据集等,帮助读者快速了解和使用这个支持多语言实验、代码切换和声音克隆的文本转语音模型。

多语言文本转语音Tacotron 2语音合成神经网络模型Meta-learningGithub开源项目
DC-TTS学习资料汇总 - 基于深度卷积网络的高效文本转语音模型

DC-TTS学习资料汇总 - 基于深度卷积网络的高效文本转语音模型

本文汇总了DC-TTS项目的相关学习资源,包括项目介绍、代码实现、数据集、训练过程、生成样本等,帮助读者快速了解和上手这个高效的文本转语音模型。

DC-TTSTensorFlow文本转语音训练模型语音样本Github开源项目