精选语音识别AI工具与应用推荐 - 免费及高效选择

wav2vec2-large-960h-lv60-self

wav2vec2-large-960h-lv60-self

模型自训练

Wav2Vec2大规模语音识别模型实现低词错误率

hubert-large-ll60k

hubert-large-ll60k

Huggingface模型

Facebook推出革新性语音表示学习模型

wav2vec2-xls-r-300m-ftspeech

wav2vec2-xls-r-300m-ftspeech

XLS-R-300mHuggingface

基于XLS-R-300m的丹麦语语音识别模型 使用FTSpeech数据集微调

wav2vec2-large-xlsr-53-romanian

wav2vec2-large-xlsr-53-romanian

模型模型微调

基于XLSR-53的罗马尼亚语语音识别模型

wav2vec2-large-xlsr-53-finnish

wav2vec2-large-xlsr-53-finnish

芬兰语模型

基于XLSR-53的芬兰语自动语音识别模型

wav2vec2-large-xlsr-53-hungarian

wav2vec2-large-xlsr-53-hungarian

模型匈牙利语

基于XLSR-53微调的匈牙利语语音识别模型

speech-separation-ami-1.0

speech-separation-ami-1.0

模型开源项目

基于pyannote.audio的多说话人语音分离与分类系统

wav2vec2-large-xlsr-53-italian

wav2vec2-large-xlsr-53-italian

Huggingface模型

XLSR-53微调的开源意大利语语音识别模型

whisper-large-v3-turbo

whisper-large-v3-turbo

WhisperHuggingface

乌兹别克语语音识别模型的高性能解决方案

wav2vec2-large-xlsr-53-swedish

wav2vec2-large-xlsr-53-swedish

Huggingface模型

基于Wav2Vec2的瑞典语语音识别模型 支持16kHz采样率

wavlm-base-plus-sv

wavlm-base-plus-sv

模型预训练模型

面向说话人验证的先进语音模型

japanese-hubert-large

japanese-hubert-large

模型rinna

大规模日语语音表示学习模型HuBERT

wav2vec2-large-xlsr-bahasa-indonesia

wav2vec2-large-xlsr-bahasa-indonesia

模型印尼语

wav2vec2架构的印尼语语音识别模型

whisper-tiny-quiztest

whisper-tiny-quiztest

Huggingface模型

微型语音识别模型为Quiz测试场景提供精准解决方案

nb-whisper-small

nb-whisper-small

Huggingface模型

先进的挪威语自动语音识别开源项目

ultravox-v0_3

ultravox-v0_3

多模态模型Whisper

集成语音和文本输入的多模态AI模型

wav2vec2-large-robust-ft-libri-960h

wav2vec2-large-robust-ft-libri-960h

模型Librispeech

多领域预训练的大规模语音识别模型

wav2vec2-xls-r-300m-hebrew

wav2vec2-xls-r-300m-hebrew

Huggingface模型

XLS-R微调的希伯来语语音识别模型

faster-whisper-tiny.en

faster-whisper-tiny.en

模型Github

轻量快速的OpenAI Whisper英语语音识别模型

larger_clap_general

larger_clap_general

模型CLAP

CLAP音频-文本预训练模型 实现零样本音频分类和特征提取