
改进后的Conformer架构实现日语长音频自动语音识别

Facebook开发的语音表征学习模型实现低资源语音识别

基于XLSR-53的波兰语语音识别模型

基于Wav2Vec2的跨语言零样本音素识别模型

精确转录语音的Wav2Vec2模型 支持标点符号输出

高效快速的英语语音识别模型

先进的FastConformer-TDT英语语音识别模型

基于wav2vec2的韩语语音识别模型实现高精度自动转写

多语言语音识别模型CTranslate2版Whisper large-v3

基于Whisper large-v2的高效多语言语音转文本模型

OpenAI Whisper large-v3-turbo 快速多语言语音识别与翻译模型

多语言音频文本强制对齐Python工具包

自监督语音表示学习模型HuBERT助力语音识别进步

Facebook开发的HuBERT大型语音识别模型实现低错误率转录

XLSR-53模型在荷兰语语音识别上的应用与性能

基于Wav2Vec2的日语语音识别模型

针对印地语优化的开源语音识别模型

NVIDIA TitaNet-Large英语说话人识别模型

AST模型实现超高精度合成语音识别

大规模多语言语音识别模型支持超1100种语言
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号