精选语音识别AI工具与应用推荐 - 免费及高效选择

Arabic-Whisper-CodeSwitching-Edition

Arabic-Whisper-CodeSwitching-Edition

代码转换Github

针对阿拉伯语和英语混合语音的优化识别模型

wav2vec2-xls-r-300m-timit-phoneme

wav2vec2-xls-r-300m-timit-phoneme

DARPA TIMIT语音识别

改进Wav2Vec2的音素识别性能的开源AI模型

hubert-base-superb-ks

hubert-base-superb-ks

语音识别音频分类

基于HuBERT的语音命令词识别与关键词检测模型

wavlm-base

wavlm-base

LibriSpeechWavLM

适用于多语音任务的自监督预训练模型

whisper-large-v3-ru-podlodka

whisper-large-v3-ru-podlodka

语音识别Github

基于Whisper Large V3的俄语优化语音识别模型

distil-small.en

distil-small.en

语音识别Github

轻量快速的英语语音识别模型,保持高准确率

wav2vec2-base-finetuned-sentiment-classification-MESD

wav2vec2-base-finetuned-sentiment-classification-MESD

机器学习Huggingface

基于Wav2Vec2的西班牙语音情感分析模型 准确率达93%

reverb-asr

reverb-asr

语音处理语音识别

基于大规模人工标注数据的开源语音识别模型

wav2vec2-xls-r-1b

wav2vec2-xls-r-1b

语音处理预训练

大规模多语言语音预训练模型支持128种语言处理

wav2vec2-large-xlsr-53-esperanto

wav2vec2-large-xlsr-53-esperanto

语音识别Github

基于XLSR-53微调的世界语语音识别模型

faster-distil-whisper-large-v3

faster-distil-whisper-large-v3

语音识别Github

基于CTranslate2的Whisper语音识别优化模型

faster-whisper-medium

faster-whisper-medium

Github模型转换

CTranslate2优化的Whisper medium模型支持多语言音频处理

whisper-large-v3-turbo

whisper-large-v3-turbo

自动语音识别语音识别

精简版Whisper语音识别系统的突破性进展

wav2vec2-large-xlsr-53-french

wav2vec2-large-xlsr-53-french

开源项目模型

法语语音识别模型实现自动语音文本转录

wav2vec2-large-lv60

wav2vec2-large-lv60

语音识别语音预训练

深度学习实现高性能语音识别 仅需少量标记数据

wavlm-base-sv

wavlm-base-sv

语音处理Github

WavLM预训练模型声纹识别与说话人验证系统

faster-whisper-medium.en

faster-whisper-medium.en

语音识别CTranslate2

优化版Whisper语音识别模型集成CTranslate2框架

overlapped-speech-detection

overlapped-speech-detection

语音识别pyannote

开源重叠语音检测工具实现多人同时发言识别

whisper-tiny.en

whisper-tiny.en

GithubWhisper

Whisper微调的英文语音识别模型

whisper-base-bungoma.en

whisper-base-bungoma.en

机器学习Github

基于Whisper的英语语音识别模型优化Azure数据集处理