最佳Github AI工具与开源项目集锦

CnSTD

CnSTD

场景文字检测数学公式检测

多语言场景文字与数学公式检测工具包

Inventory_Kamera

Inventory_Kamera

Inventory Kamera原神

基于OCR技术的原神游戏数据扫描工具

ccextractor

ccextractor

CCExtractor字幕提取

全球化开源字幕提取与处理工具

kraken

kraken

OCR系统历史文字识别

优化历史文献和多语言文本识别的开源OCR系统

DAVAR-Lab-OCR

DAVAR-Lab-OCR

DAVAR-OCR文字识别

多模态文档理解开源工具箱

awesome-ocr

awesome-ocr

OCR文本检测

综合OCR工具和技术资源库

receipt-parser-legacy

receipt-parser-legacy

Pythonreceipt parser

Python实现的模糊收据信息提取工具

PaddleOCR-json

PaddleOCR-json

PaddleOCR-jsonOCR

基于PaddleOCR的跨平台离线文字识别组件

image-text-localization-recognition

image-text-localization-recognition

场景文本检测文本识别

场景文本检测与识别研究进展资源汇总

MLKit

MLKit

MLKit机器学习

Android机器学习开发的高效工具库

HRConvert2

HRConvert2

HRConvert2文件转换

自托管文件转换与分享工具 支持445种格式

LaTeX_OCR_PRO

LaTeX_OCR_PRO

LaTeX_OCR_PRO数学公式识别

基于深度学习的多语言数学公式识别系统

obsidian-omnisearch

obsidian-omnisearch

ObsidianOmnisearch

为Obsidian打造的高效智能搜索引擎

keras-ocr

keras-ocr

keras-ocr文字识别

基于Keras的开源文本检测和OCR解决方案

TRex

TRex

TRexOCR

高效屏幕文本识别与提取工具

TextSnatcher

TextSnatcher

TextSnatcherOCR

Linux平台高效图像文字识别工具

gImageReader

gImageReader

gImageReaderOCR软件

基于tesseract-ocr的开源图像文字识别工具 支持多格式处理

normcap

normcap

NormCapOCR

跨平台OCR截图工具 智能提取文本信息

docs

docs

Teedy文档管理系统

开源轻量级文档管理系统

tesserocr

tesserocr

tesserocrOCR

Python封装的OCR引擎简化技术集成