多领域英语语音识别数据集提供10,000小时转录音频
高效准确的长音频自动转录工具
高效流式语音识别库,支持离线模式
优化Docker镜像的WhisperX语音识别与转录解决方案
多平台支持的开源语音识别工具包
开源本地AI语音聊天项目 支持自定义人格和声音
Whisper语音转录时间戳优化和功能扩展工具
高效易用的开源语音唤醒词识别库
中英文文本标准化和反标准化处理工具包
多语言语音数据集生成与处理工具
基于PyTorch的开源E2E语音识别框架 支持C++和Python
轻量级多平台实时语音识别工具
高性能自动微分FSA/FST算法库 支持语音识别
多语种语音识别开源工具箱
音频AI模型前沿进展与资源汇总
大规模语音识别数据集,50,000小时带标点和上下文
多模型语音识别开源工具包 支持日语音频分析
轻量级语音识别和合成库 基于ONNX格式优化
基于OpenAI Whisper的音频转录和说话人分离工具
视频翻译与多语言配音解决方案