精选语音识别AI工具与应用推荐 - 免费及高效选择

wav2vec2-large-960h

wav2vec2-large-960h

Huggingface模型

大规模预训练语音识别模型实现低资源高性能

Qwen-Audio-Chat

Qwen-Audio-Chat

模型多任务学习

多模态音频语言模型支持多种音频类型和复杂场景分析

wav2vec2-large-voxrex-swedish

wav2vec2-large-voxrex-swedish

Wav2vec 2.0Huggingface

基于Wav2vec 2.0的瑞典语语音识别模型实现低错误率

wav2vec2-large-xlsr-53-telugu

wav2vec2-large-xlsr-53-telugu

Telugu语言模型

基于Wav2Vec2的泰卢固语语音识别模型

distil-large-v2

distil-large-v2

模型Github

高效精简的Whisper语音识别模型

nb-wav2vec2-1b-bokmaal

nb-wav2vec2-1b-bokmaal

Huggingface模型

基于XLS-R的挪威语Bokmål语音识别模型实现高精度转录

wav2vec2-conformer-rope-large-960h-ft

wav2vec2-conformer-rope-large-960h-ft

Huggingface模型

Wav2Vec2 Conformer模型在Librispeech数据集上的语音识别应用

nb-whisper-large-beta

nb-whisper-large-beta

Huggingface模型

挪威国家图书馆开发的多语言语音识别模型NB-Whisper

distil-large-v3

distil-large-v3

模型压缩transformers

经过蒸馏的快速轻量级语音识别模型

wav2vec2-large-xlsr-malayalam

wav2vec2-large-xlsr-malayalam

MalayalamHuggingface

基于wav2vec2的马来亚拉姆语语音识别模型

wav2vec2-hausa2-demo-colab

wav2vec2-hausa2-demo-colab

模型wav2vec2

wav2vec2-large-xlsr-53 微调的 Hausa 语音识别模型

faster-distil-whisper-medium.en

faster-distil-whisper-medium.en

模型faster-whisper

基于CTranslate2的Whisper medium.en模型语音识别工具

wav2vec2-large-xlsr-53-spanish

wav2vec2-large-xlsr-53-spanish

模型西班牙语

基于XLSR-53微调的西班牙语语音识别模型

faster-whisper-large-v3-turbo-ct2

faster-whisper-large-v3-turbo-ct2

模型多语言支持

基于Whisper large-v3的多语言语音识别模型

whisperkit-coreml

whisperkit-coreml

Huggingface模型

针对苹果芯片优化的本地化语音识别开源框架

sew-d-tiny-100k-ft-ls100h

sew-d-tiny-100k-ft-ls100h

模型Github

SEW-D架构语音识别模型实现性能与效率的优化平衡

wav2vec2-large-xlsr-53-greek

wav2vec2-large-xlsr-53-greek

模型Wav2Vec2

基于wav2vec2的希腊语语音识别模型

wav2vec2-xls-r-300m-cs-250

wav2vec2-xls-r-300m-cs-250

模型模型训练

高性能捷克语语音识别模型 实现精准音频转文本

wav2vec2-large-xlsr-53

wav2vec2-large-xlsr-53

模型预训练模型

突破性多语言语音识别模型 适用低资源语言场景

w2v-xls-r-uk

w2v-xls-r-uk

模型Github

基于XLS-R的乌克兰语语音识别模型展现卓越性能