Wav2Vec2大规模语音识别模型实现低词错误率
Facebook推出革新性语音表示学习模型
基于XLS-R-300m的丹麦语语音识别模型 使用FTSpeech数据集微调
基于XLSR-53的罗马尼亚语语音识别模型
基于XLSR-53的芬兰语自动语音识别模型
基于XLSR-53微调的匈牙利语语音识别模型
基于pyannote.audio的多说话人语音分离与分类系统
XLSR-53微调的开源意大利语语音识别模型
乌兹别克语语音识别模型的高性能解决方案
基于Wav2Vec2的瑞典语语音识别模型 支持16kHz采样率
面向说话人验证的先进语音模型
大规模日语语音表示学习模型HuBERT
wav2vec2架构的印尼语语 音识别模型
微型语音识别模型为Quiz测试场景提供精准解决方案
先进的挪威语自动语音识别开源项目
集 成语音和文本输入的多模态AI模型
多领域预训练的大规模语音识别模型
XLS-R微调的希伯来语语音识别模型
轻量快速的OpenAI Whisper英语语音识别模型
CLAP音频-文本预训练模型 实现零样本音频分类和特征提取