精选语音识别AI工具与应用推荐 - 免费及高效选择

GigaSpeech

GigaSpeech语音识别

多领域英语语音识别数据集提供10,000小时转录音频

whisperX

WhisperX语音识别

高效准确的长音频自动转录工具

april-asr

april-asr语音识别

高效流式语音识别库，支持离线模式

docker-whisperX

WhisperXDocker

优化Docker镜像的WhisperX语音识别与转录解决方案

kaldi

Kaldi语音识别

多平台支持的开源语音识别工具包

LocalAIVoiceChat

AI语音聊天实时语音交互

开源本地AI语音聊天项目支持自定义人格和声音

stable-ts

Whisper时间戳

Whisper语音转录时间戳优化和功能扩展工具

openWakeWord

openWakeWord唤醒词

高效易用的开源语音唤醒词识别库

WeTextProcessing

WeTextProcessing文本归一化

中英文文本标准化和反标准化处理工具包

speech-dataset-generator

Speech Dataset Generator音频处理

多语言语音数据集生成与处理工具

sherpa

语音识别深度学习

基于PyTorch的开源E2E语音识别框架支持C++和Python

sherpa-ncnn

语音识别sherpa-ncnn

轻量级多平台实时语音识别工具

k2

k2有限状态自动机

高性能自动微分FSA/FST算法库支持语音识别

icefall

icefall语音识别

多语种语音识别开源工具箱

awesome-large-audio-models

大型音频模型语音识别

音频AI模型前沿进展与资源汇总

libriheavy

Libriheavy语音识别

大规模语音识别数据集，50,000小时带标点和上下文

ReazonSpeech

ReazonSpeech语音识别

多模型语音识别开源工具包支持日语音频分析

espnet_onnx

espnet_onnxONNX

轻量级语音识别和合成库基于ONNX格式优化

whisper-diarization

Speaker DiarizationOpenAI Whisper

基于OpenAI Whisper的音频转录和说话人分离工具

pyvideotrans

pyvideotrans视频翻译

视频翻译与多语言配音解决方案

9 10 11 12 13

探索AI的无限可能

访问

AI工具导航精选AI信息

AI云服务特惠

懂AI专属折扣

关注微信公众号

最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com