结合语音与文本处理的多模态模型
多语言语者识别解决方案,提升音频处理能力
优化德语自动语音识别的开源模型
wav2vec2提升越南语音识别精度
高级自动语音识别的Conformer-CTC模型及其与NVIDIA Riva的兼容性
加泰罗尼亚语自动语音识别模型性能表现
微调后的Facebook语音处理模型
利用微调的wav2vec2模型提升多语言语音和语素识别能力
芬兰语语音识别模型精调,提升语音转文字效果
Whisper-small-fa模型在Common Voice数据集上的语音识别性能
基于wav2vec2的泰语语音识别模型整合CommonVoice V8数据集实现性能突破
基于Wav2Vec2的语音情感识别模型实现高精度声学特征提取
印尼、爪哇和巽他语的多语言语音识别模型
XLSR-53架构英语和菲律宾语双语语音识别模型
基于XLS-R的菲律宾语语音识别模型
德语语音识别优化模型
多语言翻译与语音识别的统一模型
越南语自动语音识别模型PhoWhisper
基于Llama的端到端双模态语音助手系统
wav2vec2模型在多语言环境下的创新语音识别解决方案
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号