xtts-webui

XTTS-WebUI 项目介绍

XTTS-WebUI 是一个旨在充分利用 XTTS（跨模态文本到语音转换系统）的网络用户界面。该项目通过多种神经网络和工具的集成，大大提升了处理结果的质量，并为用户提供了定制和微调模型的选项，从而生成高质量的语音模型。

项目特点

便携版本
XTTS-WebUI 现已提供便携版本，这意味着用户无需安装所有依赖项即可使用。只需 Windows 操作系统和拥有 6 GB 视频内存的 Nvidia 显卡即可运行。
多功能语言支持
项目已提供多种语言的说明文档，包括英文、俄文和葡萄牙文，方便不同语言的用户获取帮助。
主要功能
- 简化了 XTTSv2 的使用流程。
- 提供批处理，适用于大批音频文件配音。
- 支持音频翻译并保留原声。
- 集成神经网络和音频工具，自动优化处理结果。
- 可方便地微调模型并立即使用。
- 提供多种工具如 RVC、OpenVoice、Resemble Enhance，可组合使用。
- 可自定义生成参数和说话样本。

未来计划

完成任务：
- 增加进度和错误信息的状态栏。
- 将训练集成到标准界面。
计划任务：
- 增加流式检查结果的能力。
- 提供新的文本处理方式以进行语音合成。
- 允许在批处理时自定义说话人。
- 添加 API 支持。

安装指南

XTTS-WebUI 可以通过 Google Colab 使用。请确保安装了 Python 3.10.x 或 3.11、CUDA 11.8 或 12.1、Microsoft Builder Tools 2019（包含 C++ 包）和 ffmpeg。

方法一：通过脚本

Windows 操作系统：

运行 install.bat 文件来安装。
运行 start_xtts_webui.bat 启动界面。
在浏览器中打开控制台显示的本地地址。

Linux 操作系统：

运行 install.sh 文件来安装。
运行 start_xtts_webui.sh 启动界面。
在浏览器中打开控制台显示的本地地址。

方法二：手动安装

确保安装了 CUDA。
克隆仓库：git clone https://github.com/daswer123/xtts-webui
进入目录：cd xtts-webui
创建虚拟环境：python -m venv venv
激活虚拟环境：
- Windows：venv\scripts\activate
- Linux：source venv/bin/activate

使用 pip 安装 PyTorch 和 torchaudio：

pip install torch==2.1.1+cu118 torchaudio==2.1.1+cu118 --index-url https://download.pytorch.org/whl/cu118

从 requirements.txt 安装所有依赖：
```
pip install -r requirements.txt
```

应用程序运行

启动界面，请按以下步骤操作：

激活虚拟环境：

venv/scripts/activate

或在 Linux 下：

source venv/bin/activate

运行以下命令启动 webui：
```
python app.py
```

XTTS-WebUI 和官方 WebUI 的区别

数据处理：更新了 faster-whisper 版本，改进了输出目录处理。
微调 XTTS 编码器：增加选择基模型和优化模型的功能。
推理：支持自定义推理设置。
其他改进：增强了界面的稳定性和多语言支持，增加了日语支持。

XTTS-WebUI 提供了多种选项和工具，简化了文本到语音转换的流程，提高了语音模型的质量和效果。通过不同模块的集成，用户可以更灵活地处理和优化音频数据，是一款功能强大的工具。

XTTS-WebUI 项目介绍

项目特点

未来计划

安装指南

方法一：通过脚本

方法二：手动安装

应用程序运行

XTTS-WebUI 和官方 WebUI 的区别

编辑推荐精选

扣子-AI办公

堆友

码上飞

Vora

Refly.AI

酷表ChatExcel

TRAE编程

AIWritePaper论文写作

博思AIPPT

潮际好麦

探索AI的无限可能

推荐工具精选

TRAE编程

扣子-AI办公

码上飞

商汤小浣熊

讯飞绘文

讯飞绘镜

iTerms

AI云服务特惠

火山引擎

阿里云

腾讯云

华为云

百度智能云

AWS

关注微信公众号