本地运行的跨平台语音转文字引擎
实验性音频预处理工具提升Whisper转录准确度
多语言语音识别基准测试平台 促进ASR系统评估
整合Whisper和pyannote.audio的语音识别与说话人分割工具
基于HuggingFace的语音处理开源工具库
开源多模型语音识别框架
中文数字与阿拉伯数字互转的Python库
INTERSPEECH 2024语音和语言处理研究最新进展
基于PaddlePaddle的开源流式与非流式语音识别框架
基于Pytorch的开源自动语音识别框架
开源自托管语音转文字API项目
基于PaddlePaddle的开源中文语音识别系统
多协议支持的高准确度离线语音识别服务器
轻松获取YouTube视频字幕的Python API库
基于深度学习的多功能车牌识别系统
多语言屏幕实时OCR和翻译工具
基于OpenCV和NumPy的轻量级Python OCR工具
Zotero OCR插件实现PDF文献自动文本识别
Tesseract 5训练流程自动化工具
全面的PDF和电子文档处理开发工具集
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号