精选语音识别AI工具与应用推荐 - 免费及高效选择

ultravox-v0_4

ultravox-v0_4

模型语音识别

结合语音与文本处理的多模态模型

voxcelebs12_rawnet3

voxcelebs12_rawnet3

多语言语音识别

多语言语者识别解决方案,提升音频处理能力

wav2vec2-large-xlsr-53-german

wav2vec2-large-xlsr-53-german

Common VoiceWav2Vec2

优化德语自动语音识别的开源模型

wav2vec2-base-vietnamese-250h

wav2vec2-base-vietnamese-250h

开源项目模型

wav2vec2提升越南语音识别精度

stt_en_conformer_ctc_large

stt_en_conformer_ctc_large

NVIDIA Riva语音识别

高级自动语音识别的Conformer-CTC模型及其与NVIDIA Riva的兼容性

Wav2Vec2-Large-XLSR-53-catalan

Wav2Vec2-Large-XLSR-53-catalan

Common VoiceWav2Vec2

加泰罗尼亚语自动语音识别模型性能表现

wav2vec2-xls-r-300m-phoneme

wav2vec2-xls-r-300m-phoneme

wav2vec2-xls-r-300m语音识别

微调后的Facebook语音处理模型

wav2vec2-lv-60-espeak-cv-ft

wav2vec2-lv-60-espeak-cv-ft

语音识别Huggingface

利用微调的wav2vec2模型提升多语言语音和语素识别能力

wav2vec2-xlsr-1b-finnish-lm-v2

wav2vec2-xlsr-1b-finnish-lm-v2

芬兰语语音识别

芬兰语语音识别模型精调,提升语音转文字效果

whisper-small-fa

whisper-small-fa

训练超参数Transformers

Whisper-small-fa模型在Common Voice数据集上的语音识别性能

wav2vec2-large-xlsr-53-th-cv8-newmm

wav2vec2-large-xlsr-53-th-cv8-newmm

Wav2Vec2语音转文本

基于wav2vec2的泰语语音识别模型整合CommonVoice V8数据集实现性能突破

wav2vec2-base-superb-er

wav2vec2-base-superb-er

情感识别IEMOCAP

基于Wav2Vec2的语音情感识别模型实现高精度声学特征提取

wav2vec2-indonesian-javanese-sundanese

wav2vec2-indonesian-javanese-sundanese

Github开源项目

印尼、爪哇和巽他语的多语言语音识别模型

english-filipino-wav2vec2-l-xls-r-test-09

english-filipino-wav2vec2-l-xls-r-test-09

Huggingfacewav2vec2

XLSR-53架构英语和菲律宾语双语语音识别模型

filipino-wav2vec2-l-xls-r-300m-official

filipino-wav2vec2-l-xls-r-300m-official

模型训练开源项目

基于XLS-R的菲律宾语语音识别模型

whisper-large-v3-german

whisper-large-v3-german

自动字幕OpenAI

德语语音识别优化模型

hf-seamless-m4t-medium

hf-seamless-m4t-medium

Hugging FaceGithub

多语言翻译与语音识别的统一模型

PhoWhisper-large

PhoWhisper-large

Github机器学习

越南语自动语音识别模型PhoWhisper

DiVA-llama-3-v0-8b

DiVA-llama-3-v0-8b

语音识别Github

基于Llama的端到端双模态语音助手系统

wav2vec2-xls-r-300m-mixed

wav2vec2-xls-r-300m-mixed

KerasGithub

wav2vec2模型在多语言环境下的创新语音识别解决方案