faster-whisper

更快更高效的 Whisper 转录：faster-whisper 项目介绍

faster-whisper 是一个基于 CTranslate2 引擎的 OpenAI Whisper 模型重新实现。CTranslate2 是一个专为 Transformer 模型设计的高效推理引擎。这个项目的目标是在保持相同准确度的同时，提供比原始 Whisper 实现更快的转录速度和更低的内存占用。

性能优势

根据基准测试，faster-whisper 相比原始的 openai/whisper 实现有以下显著优势：

速度提升：在相同硬件条件下，faster-whisper 可以将转录速度提高到原来的 4 倍。
内存效率：faster-whisper 在 GPU 和 CPU 上都能显著降低内存使用。
量化支持：通过 8 位量化技术，可以进一步提高效率，同时保持转录质量。

系统要求

faster-whisper 需要 Python 3.8 或更高版本。对于 GPU 执行，还需要安装 NVIDIA 的 cuBLAS 和 cuDNN 库。项目提供了多种安装这些库的方法，包括使用 Docker、通过 pip 安装或直接下载预编译库。

安装和使用

用户可以通过 pip 轻松安装 faster-whisper：

pip install faster-whisper

使用时，只需几行代码即可完成音频转录：

from faster_whisper import WhisperModel

model = WhisperModel("large-v3", device="cuda", compute_type="float16")
segments, info = model.transcribe("audio.mp3", beam_size=5)

for segment in segments:
    print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))