
结合语音与文本处理的多模态模型

多语言语者识别解决方案,提升音频处理能力

优化德语自动语音识别的开源模型

wav2vec2提升越南语音识别精度

高级自动语音识别的Conformer-CTC模型及其与NVIDIA Riva的兼容性

加泰罗尼亚语自动语音识别模型性能表现

微调后的Facebook语音处理模型

利用微调的wav2vec2模型提升多语言语音和语素识别能力

芬兰语语音识别模型精调,提升语音转文字效果

Whisper-small-fa模型在Common Voice数据集上的语音识别性能

基于wav2vec2的泰语语音识别模型整合CommonVoice V8数据集实现性能突破

基于Wav2Vec2的语音情感识别模型实现高精度声学特征提取

印尼、爪哇和巽他语的多语言语音识别模型

XLSR-53架构英语和菲律宾语双语语音识别模型

基于XLS-R的菲律宾语语音识别模型

德语语音识别优化模型

多语言翻译与语音识别的统一模型

越南语自动语音识别模型PhoWhisper

基于Llama的端到端双模态语音助手系统

wav2vec2模型在多语言环境下的创新语音识别解决方案
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号