精选语音识别AI工具与应用推荐 - 免费及高效选择

whisper-medium-fleurs-lang-id

whisper-medium-fleurs-lang-id

FLEURS数据集Whisper

Whisper Medium微调模型实现多语言音频识别

mms-300m

mms-300m

Huggingface模型

Facebook AI推出大规模多语言语音预训练模型

wav2vec2-large-xlsr-53-gender-recognition-librispeech

wav2vec2-large-xlsr-53-gender-recognition-librispeech

模型Librispeech

Wav2Vec2模型在Librispeech数据集上的音频性别识别应用

faster-whisper-small

faster-whisper-small

WhisperHuggingface

优化的Whisper小型模型实现快速多语言语音转文本

wav2vec2-xls-r-300m-cv7-turkish

wav2vec2-xls-r-300m-cv7-turkish

模型wav2vec2-xls-r-300m

基于Wav2vec2优化的土耳其语语音识别模型

faster-whisper-tiny

faster-whisper-tiny

faster-whisperWhisper

CTranslate2格式Whisper小型模型实现多语言语音识别

wav2vec2-large-xlsr-53-th

wav2vec2-large-xlsr-53-th

模型Common Voice

基于Common Voice数据集微调的泰语语音识别模型

wav2vec2-base-vi

wav2vec2-base-vi

模型Wav2Vec2

基于wav2vec2的越南语自监督学习模型提升语音识别性能

faster-whisper-base.en

faster-whisper-base.en

模型faster-whisper

基于CTranslate2的Whisper英语语音识别模型

clap-htsat-unfused

clap-htsat-unfused

音频嵌入Huggingface

CLAP音频-文本预训练模型实现零样本音频分类

wav2vec2-large-xlsr-53-persian

wav2vec2-large-xlsr-53-persian

模型Common Voice

基于XLSR-53微调的开源波斯语语音识别模型

kotoba-whisper-v2.1

kotoba-whisper-v2.1

模型Kotoba-Whisper

日语语音识别模型优化版:提升精度和功能

faster-whisper-base

faster-whisper-base

WhisperHuggingface

OpenAI Whisper模型在CTranslate2格式下的应用

faster-whisper-large-v2

faster-whisper-large-v2

模型Whisper

多语言语音识别模型 支持高效转录和翻译

wav2vec2-xls-r-1b-portuguese

wav2vec2-xls-r-1b-portuguese

模型Common Voice

XLS-R 1B微调的葡萄牙语语音识别模型

wavlm-libri-clean-100h-base-plus

wavlm-libri-clean-100h-base-plus

微调模型

WavLM微调模型在LibriSpeech数据集上的语音识别性能

autonlp-Gibberish-Detector-492513457

autonlp-Gibberish-Detector-492513457

模型Github

英语无意义文本智能分类模型

spkrec-ecapa-voxceleb

spkrec-ecapa-voxceleb

SpeechBrain说话人验证

基于SpeechBrain的ECAPA-TDNN说话人验证系统

wav2vec2-large-xls-r-300m-Urdu

wav2vec2-large-xls-r-300m-Urdu

Urdu语音识别

基于wav2vec2的乌尔都语语音识别模型

wav2vec2-large-robust-24-ft-age-gender

wav2vec2-large-robust-24-ft-age-gender

模型音频分类

Wav2vec 2.0驱动的24层神经网络实现音频年龄性别识别