
Facebook开发的高效语音识别模型

Facebook开发的大规模多语言预训练语音模型

突破性多语言语音识别与翻译模型

XLSR-53微调的葡萄牙语语音识别模型

高效实时的开源语音说话人分割系统

基于XLSR-53的俄语语音识别微调模型

中文自动语音识别模型提供广泛应用支持

提升语音处理的开源说话人分区技术

XLSR-53微调的英语语音识别模型

跨语言即时翻译和转录的电话应用

开源视频自动字幕生成工具

通用听觉能力赋能大语言模型 实现音频输入的多模态理解

Python多引擎语音识别库

增强实时通信应用的开源FreeSWITCH模块集

将多模态嵌入到大语言模型的开源框架

虚幻引擎整合Azure语音服务的开源插件

面向边缘计算的实时语音识别平台

智能识别YouTube视频赞助内容的神经网络工具

全面汇总俄语语音技术资源与开发工具

全面语音处理技术课程,从信号处理到人工智能应用
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号