
一键音频转文本,自动保存到剪贴板
WhisperClip是一款自动转录音频并将文本直接保存至剪贴板的工具。只需点击按钮即可将口语转换为书面文本。应用支持Python 3.8及以上版本,使用OpenAI的Whisper技术,无论GPU还是CPU都能选择合适的模型以确保最佳性能。用户可以提供反馈并参与改进项目。
WhisperClip 是一个自动音频转录工具,旨在通过简化将语音内容转换为文字的过程来提高生活和工作效率。它利用了 OpenAI 的 Whisper 技术,为用户提供免费和便捷的音频转文本功能。用户只需轻轻一按按钮,即可将语音内容快速转为文本,并直接复制到剪贴板以供使用。
克隆代码仓库:
git clone https://github.com/gustavostz/whisper-clip.git
cd whisper-clip
如果还没有安装 PyTorch,可以参考 PyTorch 官网进行安装。
安装必要的依赖:
pip install -r requirements.txt
根据 GPU 的显存选择适合的 Whisper 模型,以获得最佳性能。以下是可用模型及其所需显存和相对速度的表格:
| 大小 | 所需显存 | 相对速度 |
|---|---|---|
| tiny | ~1 GB | ~32x |
| base | ~1 GB | ~16x |
| small | ~2 GB | ~6x |
| medium | ~5 GB | ~2x |
| large | ~10 GB | 1x |
对于仅英语的应用,.en 模型(例如:tiny.en,base.en)的效果通常更佳。要更换模型,可以在 config.json 文件中修改 model_name 变量为所需的模型名称。
运行应用程序:
python main.py
Alt+Shift+R,用户可以在 config.json 文件中进行修改。config.json 文件中更改用于转录的 Whisper 模型。如果用户对更友好、可执行的 WhisperClip 版本感兴趣,项目开发者乐意考虑制作一版。欢迎通过 GitHub 提交反馈和建议。
该项目使用了 OpenAI 的 Whisper 技术进行音频转录。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具


最适合小白的AI自动化工作流平台
无需编码,轻松生成可复用、可变现的AI自动化工作流

大模型驱动的Excel数据处理工具
基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。


AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。