voicefixer

VoiceFixer 项目介绍

工程概览

VoiceFixer 是一款旨在修复人类语音的工具，无论语音降级程度多么严重，它都能处理。这款工具可以处理噪声、混响、低分辨率（2kHz~44.1kHz）以及削波（阈值0.1-1.0）的影响，并在一个模型中集成这些功能。VoiceFixer 提供了一个预训练模型，基于神经声码器构建，还支持通用的44.1kHz的与特定说话人无关的神经声码器。

项目特点

Demo

用户可以通过访问演示页面观察 VoiceFixer 的工作效果，了解其实际应用。

使用指南

运行模式

VoiceFixer 提供多种运行模式，以应对不同的语音处理需求：

模式0：原始模型，默认建议使用。
模式1：添加预处理模块（去除高频）。
模式2：训练模式，有时可用于严重降级的实际语音。
全部模式：运行所有模式，输出每种支持模式的一个WAV文件。

命令行使用

用户可以通过以下步骤在命令行中使用 VoiceFixer：

首先，通过 pip 安装 VoiceFixer：

pip install git+https://github.com/haoheliu/voicefixer.git

处理单个文件：

# 指定输入的 .wav 文件。默认输出文件为 outfile.wav。
voicefixer --infile test/utterance/original/original.wav
# 或者指定输出路径
voicefixer --infile test/utterance/original/original.wav --outfile test/utterance/original/original_processed.wav

处理文件夹中的文件：

voicefixer --infolder /路径/到/输入 --outfolder /路径/到/输出

更改模式（默认模式为0）：

voicefixer --infile /路径/到/输入.wav --outfile /路径/到/输出.wav --mode 1

运行所有模式：

voicefixer --infile /路径/到/输入.wav --outfile /路径/到/输出.wav --mode all

仅加载权重而不进行任何实际处理：
```
voicefixer --weight_prepare
```

若需更多帮助信息，请运行：

voicefixer -h

桌面应用程序

用户还可以通过桌面应用程序进行操作。用户需首先通过 pip 安装 VoiceFixer，然后通过 Streamlit 网站测试音频样本：

克隆代码库：

git clone https://github.com/haoheliu/voicefixer.git
cd voicefixer

启动网页：
```
streamlit run test/streamlit.py
```

Python 示例

用户可以通过以下步骤在 Python 中使用 VoiceFixer：

通过 pip 安装 VoiceFixer：
```
pip install voicefixer
```

运行脚本进行测试：

git clone https://github.com/haoheliu/voicefixer.git; cd voicefixer
python3 test/test.py # 测试脚本

Docker 使用

尽管 VoiceFixer 的 Docker 镜像尚未发布，需要在本地构建，但这保证了用户运行时具备所有预期的配置。

其他功能

VoiceFixer 允许用户使用自定义的声码器，用户需编写一个助手函数并在 voicefixer.restore 中传递该函数，使该工具支持用户自定义的音频处理需求。

附加资源

VoiceFixer 训练代码库: GitHub链接
项目演示页面: 演示页面

更新日志

更新信息可参见 CHANGELOG.md。

VoiceFixer 项目介绍

工程概览

项目特点

Demo

使用指南

运行模式

命令行使用

桌面应用程序

Python 示例

Docker 使用

其他功能

附加资源

更新日志

编辑推荐精选

扣子-AI办公

堆友

码上飞

Vora

Refly.AI

酷表ChatExcel

TRAE编程

AIWritePaper论文写作

博思AIPPT

潮际好麦

探索AI的无限可能

推荐工具精选

TRAE编程

扣子-AI办公

码上飞

商汤小浣熊

讯飞绘文

讯飞绘镜

iTerms

AI云服务特惠

火山引擎

阿里云

腾讯云

华为云

百度智能云

AWS

关注微信公众号