最佳OCR工具大全:AI驱动的OCR软件、网站及开源项目精选

tessdoc

tessdoc

TesseractOCR

多语言支持的开源文字识别引擎

texify

texify

TexifyOCR

高效OCR模型,图像数学公式到Markdown和LaTeX的转换工具

TexTeller

TexTeller

TexTeller公式识别

端到端公式识别模型 支持多种输入格式

large-ocr-model.github.io

large-ocr-model.github.io

OCR大型模型

OCR 技术提升多模态大模型视觉问答性能研究

marker-api

marker-api

PDF转MarkdownMarker API

高效精准的PDF到Markdown转换工具

ocrs

ocrs

OCRRust

基于Rust的开源OCR引擎和命令行工具

tarsier

tarsier

Tarsier网页交互

网页交互感知系统赋能AI代理执行网络任务

marker

marker

PDF转换Markdown

高效准确的PDF转Markdown转换器 支持多语言和多类文档

surya

surya

SuryaOCR

开源多语言文档识别与分析工具

tesseract.js-core

tesseract.js-core

Tesseract.jsWebAssembly

Tesseract OCR引擎的JavaScript WebAssembly实现

tessdata

tessdata

Tesseract.js训练数据

Tesseract.js OCR语言数据集综合指南

ddddocr

ddddocr

DdddOcr验证码识别

多功能验证码识别库 支持OCR与目标检测

AIAS

AIAS

AIAS图像识别

专为图像识别和自然语言处理设计的高效SDK集合,提升开发效率

attention-ocr

attention-ocr

Attention-OCRTensorflow

基于注意力机制的视觉OCR模型,实现与导出工具

Pix2Text

Pix2Text

Pix2TextOCR

开源Python工具,支持高精度数学公式检测和80多种语言的文本识别

doctr

doctr

docTROCR

由深度学习提供支持的无缝、高性能和可访问的库,用于 OCR 相关任务

tr

tr

trOCR

高效的离线OCR文本识别与文档理解SDK

Octopii

Octopii

OctopiiPII

个人信息泄露检测工具,自动识别和提取敏感数据

deepdoctection

deepdoctection

deepdoctection文档AI

文档AI:基于深度学习的提取与布局分析工具包

receipt-scanner

receipt-scanner

TextractOCR

利用AI技术为Laravel应用从多种格式中提取结构化收据和发票数据