whisper-clip

WhisperClip 项目介绍

WhisperClip 是一个自动音频转录工具，旨在通过简化将语音内容转换为文字的过程来提高生活和工作效率。它利用了 OpenAI 的 Whisper 技术，为用户提供免费和便捷的音频转文本功能。用户只需轻轻一按按钮，即可将语音内容快速转为文本，并直接复制到剪贴板以供使用。

功能介绍

轻松点击即可录制音频。
使用 Whisper 技术自动转录音频（免费使用）。
选择将转录内容直接保存到剪贴板。

安装指南

先决条件

需要安装 Python 3.8 或更高版本。
推荐使用 CUDA 以提高性能，但不是必需的，WhisperClip 也可以在 CPU 上运行。

环境搭建

克隆代码仓库：

git clone https://github.com/gustavostz/whisper-clip.git
cd whisper-clip

如果还没有安装 PyTorch，可以参考 PyTorch 官网进行安装。
安装必要的依赖：
```
pip install -r requirements.txt
```

选择合适的模型

根据 GPU 的显存选择适合的 Whisper 模型，以获得最佳性能。以下是可用模型及其所需显存和相对速度的表格：

大小	所需显存	相对速度
tiny	~1 GB	~32x
base	~1 GB	~16x
small	~2 GB	~6x
medium	~5 GB	~2x
large	~10 GB	1x

对于仅英语的应用，.en 模型（例如：tiny.en，base.en）的效果通常更佳。要更换模型，可以在 config.json 文件中修改 model_name 变量为所需的模型名称。

使用方法

运行应用程序：

python main.py

点击麦克风按钮开始和停止录音。
如果选中“保存到剪贴板”选项，转录文本将会自动复制到您的剪贴板。

配置设置

默认的录音快捷键是 Alt+Shift+R，用户可以在 config.json 文件中进行修改。
您还可以在 config.json 文件中更改用于转录的 Whisper 模型。

反馈

如果用户对更友好、可执行的 WhisperClip 版本感兴趣，项目开发者乐意考虑制作一版。欢迎通过 GitHub 提交反馈和建议。

鸣谢

该项目使用了 OpenAI 的 Whisper 技术进行音频转录。

WhisperClip 项目介绍

功能介绍

安装指南

先决条件

环境搭建

选择合适的模型

使用方法

配置设置

反馈

鸣谢

编辑推荐精选

扣子-AI办公

堆友

码上飞

Vora

Refly.AI

酷表ChatExcel

TRAE编程

AIWritePaper论文写作

博思AIPPT

潮际好麦

探索AI的无限可能

推荐工具精选

TRAE编程

扣子-AI办公

码上飞

商汤小浣熊

讯飞绘文

讯飞绘镜

iTerms

AI云服务特惠

火山引擎

阿里云

腾讯云

华为云

百度智能云

AWS

关注微信公众号