
实时语音代理构建框架,支持大规模并发处理

多平台本地运行的语音处理开源项目

语音识别与深度学习的理论与实践总结

开源TensorFlow中的语音识别示例

中文语音识别系统,支持多平台和多种API接口

多语言语音识别工具,支持单词时间戳和置信度评分

微调与加速Whisper模型

Python 语音识别工具

多语言语音识别与合成数据集详细介绍及应用

深度学习音频处理综合课程

Whisper模型用于YouTube视频的多语言转录和语言识别

Tensorflow 2和Conformer结合的端到端语音识别解决方案

结合卷积神经网络和Transformers的语音识别模型

轻量精准的全栈语音识别解决方案

多功能开源语音转文字API,支持多语言和多任务

利用AI技术实时生成面试问答,提升面试效率

Next.js实现的自动语音识别,支持实时转录和录音回放

介绍在Android应用中如何集成Whisper和Recorder类,进行高效的音频录制和语音识别的指南

基于OpenAI的Whisper的语音识别项目

适用于OpenAI Whisper API的React Hook,支持语音录制和静音消除
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号