
本地运行的跨平台语音转文字引擎

实验性音频预处理工具提升Whisper转录准确度

多语言语音识别基准测试平台 促进ASR系统评估

整合Whisper和pyannote.audio的语音识别与说话人分割工具

基于HuggingFace的语音处理开源工具库

开源多模型语音识别框架

中文数字与阿拉伯数字互转的Python库

INTERSPEECH 2024语音和语言处理研究最新进展

基于PaddlePaddle的开源流式与非流式语音识别框架

基于Pytorch的开源自动语音识别框架

开源自托管语音转文字API项目

基于PaddlePaddle的开源中文语音识别系统

多协议支持的高准确度离线语音识别服务器

轻松获取YouTube视频字幕的Python API库

基于深度学习的多功能车牌识别系统

多语言屏幕实时OCR和翻译工具

基于OpenCV和NumPy的轻量级Python OCR工具

Zotero OCR插件实现PDF文献自动文本识别

Tesseract 5训练流程自动化工具

全面的PDF和电子文档处理开发工具集
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号