Facebook开发的高效语音识别模型
Facebook开发的大规模多语言预训练语音模型
突破性多语言语音识别与翻译模型
XLSR-53微调的葡萄牙语语音识别模型
高效实时的开源语音说话人分割系统
基于XLSR-53的俄语语音识别微调模型
中文自动语音识别模型提供广泛应用支持
提升语音处理的开源说话人分区技术
XLSR-53微调的英语语音识别模型
跨语言即时翻译和转录的电话应用
开源视频自动字幕生成工具
通用听觉能力赋能大语言模型 实现音频输入的多模态理解
Python多引擎语音识别库
增强实时通信应用的开源FreeSWITCH模块集
将多模态嵌入到大语言模型的开源框架
虚幻引擎整合Azure语音服务的开源插件
面向边缘计算的实时语音识别平台
智能识别YouTube视频赞助内容的神经网络工具
全面汇总俄语语音技术资源与开发工具
全面语音处理技术课程,从信号处理到人工智能应用
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号