精选语音识别AI工具与应用推荐 - 免费及高效选择

GigaSpeech

GigaSpeech

GigaSpeech语音识别

多领域英语语音识别数据集提供10,000小时转录音频

whisperX

whisperX

WhisperX语音识别

高效准确的长音频自动转录工具

april-asr

april-asr

april-asr语音识别

高效流式语音识别库,支持离线模式

docker-whisperX

docker-whisperX

WhisperXDocker

优化Docker镜像的WhisperX语音识别与转录解决方案

kaldi

kaldi

Kaldi语音识别

多平台支持的开源语音识别工具包

LocalAIVoiceChat

LocalAIVoiceChat

AI语音聊天实时语音交互

开源本地AI语音聊天项目 支持自定义人格和声音

stable-ts

stable-ts

Whisper时间戳

Whisper语音转录时间戳优化和功能扩展工具

openWakeWord

openWakeWord

openWakeWord唤醒词

高效易用的开源语音唤醒词识别库

WeTextProcessing

WeTextProcessing

WeTextProcessing文本归一化

中英文文本标准化和反标准化处理工具包

speech-dataset-generator

speech-dataset-generator

Speech Dataset Generator音频处理

多语言语音数据集生成与处理工具

sherpa

sherpa

语音识别深度学习

基于PyTorch的开源E2E语音识别框架 支持C++和Python

sherpa-ncnn

sherpa-ncnn

语音识别sherpa-ncnn

轻量级多平台实时语音识别工具

k2

k2

k2有限状态自动机

高性能自动微分FSA/FST算法库 支持语音识别

icefall

icefall

icefall语音识别

多语种语音识别开源工具箱

awesome-large-audio-models

awesome-large-audio-models

大型音频模型语音识别

音频AI模型前沿进展与资源汇总

libriheavy

libriheavy

Libriheavy语音识别

大规模语音识别数据集,50,000小时带标点和上下文

ReazonSpeech

ReazonSpeech

ReazonSpeech语音识别

多模型语音识别开源工具包 支持日语音频分析

espnet_onnx

espnet_onnx

espnet_onnxONNX

轻量级语音识别和合成库 基于ONNX格式优化

whisper-diarization

whisper-diarization

Speaker DiarizationOpenAI Whisper

基于OpenAI Whisper的音频转录和说话人分离工具

pyvideotrans

pyvideotrans

pyvideotrans视频翻译

视频翻译与多语言配音解决方案