值得探索的AI开源项目:工具、网站与应用合集

MORT: 实时游戏翻译器项目

MORT: 实时游戏翻译器项目

MORT是一款强大的实时游戏翻译工具,利用OCR技术提取游戏对话,并通过数据库或机器翻译实现即时翻译输出。它支持多种OCR和翻译引擎,可实现多语言翻译,是游戏本地化和跨语言游戏体验的理想助手。

MORTOCR实时翻译机器翻译多语言支持Github开源项目
Zotero OCR插件:提升PDF文档管理效率的利器

Zotero OCR插件:提升PDF文档管理效率的利器

Zotero OCR是一款强大的Zotero插件,可以为PDF文档添加光学字符识别(OCR)功能,大大提升了学术文献管理的效率。本文将详细介绍Zotero OCR插件的功能特点、安装使用方法以及用户反馈,帮助读者充分利用这一工具改善文献管理体验。

ZoteroOCRPDFTesseract插件Github开源项目
Tesstrain: 深入解析Tesseract LSTM训练工具

Tesstrain: 深入解析Tesseract LSTM训练工具

Tesstrain是一个强大的Tesseract LSTM训练工具,它简化了OCR模型的训练过程。本文将深入探讨Tesstrain的功能、使用方法和最佳实践,帮助开发者更好地利用这一工具提升OCR精度。

TesseractOCR模型训练机器学习图像处理Github开源项目
DAVAR-Lab-OCR: 海康威视研究院开源的OCR工具箱

DAVAR-Lab-OCR: 海康威视研究院开源的OCR工具箱

DAVAR-Lab-OCR是由海康威视研究院DAVAR实验室开发的开源OCR工具箱,集成了多种先进的文字检测、识别和场景文本理解算法,为OCR研究和应用提供了强大支持。

DAVAR-OCR文字识别文档理解开源代码库算法实现Github开源项目
CnSTD:强大的中英文场景文字检测与版面分析工具

CnSTD:强大的中英文场景文字检测与版面分析工具

CnSTD是一款基于PyTorch的开源场景文字检测工具,支持中英文文字检测、数学公式检测和版面分析,具有高精度、快速和易用等特点。本文详细介绍了CnSTD的功能、安装方法、模型选择和使用方法等内容。

场景文字检测数学公式检测CnSTDPyTorch模型Github开源项目
PyMuPDF-Utilities: 强大的PDF处理工具箱

PyMuPDF-Utilities: 强大的PDF处理工具箱

PyMuPDF-Utilities是一个包含各种PDF处理示例和实用工具的开源项目,为开发者提供了丰富的PDF操作参考和解决方案。

PyMuPDFPDF处理文本提取OCR文档处理Github开源项目
Kraken: 革命性的多语言OCR引擎

Kraken: 革命性的多语言OCR引擎

Kraken是一个专为历史文献和非拉丁文本优化的开源OCR系统,具有全面的训练能力、多脚本支持和灵活的输出选项,为数字人文研究提供了强大的文本识别工具。

OCR系统历史文字识别非拉丁文识别kraken文本识别Github开源项目
探索OCR技术的前沿:解析GitHub热门项目awesome-ocr

探索OCR技术的前沿:解析GitHub热门项目awesome-ocr

本文深入分析了GitHub上广受欢迎的awesome-ocr项目,全面介绍了OCR技术的最新进展和开源资源,为OCR爱好者和开发者提供了宝贵的学习参考。

OCR文本检测文档分析图像处理深度学习Github开源项目
图像文本定位与识别技术的发展与应用

图像文本定位与识别技术的发展与应用

本文全面介绍了图像文本定位与识别技术的发展历程、主要方法和最新进展,探讨了该技术在实际应用中的价值和挑战。

场景文本检测文本识别深度学习计算机视觉人工智能Github开源项目
Receipt Parser Legacy:一个基于Python和Tesseract OCR的开源收据解析工具

Receipt Parser Legacy:一个基于Python和Tesseract OCR的开源收据解析工具

Receipt Parser Legacy是一个使用Python编写的开源收据解析工具,利用Tesseract OCR来从超市收据图像中提取信息。它可以作为独立脚本运行,也可以集成到更大的应用程序中,为用户提供收据数据的自动化提取功能。

Pythonreceipt parser图像处理文本提取开源项目Github
PaddleOCR-json: 一个便捷高效的离线OCR识别组件

PaddleOCR-json: 一个便捷高效的离线OCR识别组件

PaddleOCR-json是一个基于PaddleOCR的简单封装,可以将OCR识别结果以JSON格式输出,方便各种编程语言调用。它提供了多语言API,使开发者可以轻松地在自己的项目中集成高效准确的OCR功能。

PaddleOCR-jsonOCR图像识别离线组件APIGithub开源项目
MLKit: 为移动开发者提供强大易用的机器学习工具包

MLKit: 为移动开发者提供强大易用的机器学习工具包

MLKit是一个基于Google ML Kit封装的强大易用的机器学习工具包,可以帮助移动开发者轻松实现文字识别、条码扫描、人脸检测等功能。

MLKit机器学习图像识别AndroidGoogleGithub开源项目
Obsidian Omnisearch: 一款"开箱即用"的强大搜索插件

Obsidian Omnisearch: 一款"开箱即用"的强大搜索插件

Obsidian Omnisearch是一款为Obsidian笔记软件开发的搜索插件,能够快速、智能地定位笔记内容,支持OCR和PDF索引,是提升笔记检索效率的得力助手。

ObsidianOmnisearch搜索引擎插件文档查找Github开源项目
keras-ocr: 一个灵活强大的OCR工具包

keras-ocr: 一个灵活强大的OCR工具包

keras-ocr是一个基于Keras和TensorFlow的开源OCR工具包,集成了最新的文本检测和识别模型,提供了简单易用的API,可以快速实现高精度的文字识别功能。

keras-ocr文字识别深度学习计算机视觉图像处理Github开源项目
LaTeX_OCR_PRO: 强大的数学公式识别工具

LaTeX_OCR_PRO: 强大的数学公式识别工具

LaTeX_OCR_PRO是一个开源项目,旨在通过深度学习技术实现数学公式的准确识别和LaTeX代码生成。它支持中英文手写和印刷公式,并具有初级符号推导能力,是一个功能强大的数学OCR工具。

LaTeX_OCR_PRO数学公式识别Seq2SeqAttention机器学习Github开源项目
TRex:让文本捕捉变得简单而强大的macOS工具

TRex:让文本捕捉变得简单而强大的macOS工具

TRex是一款创新的macOS应用,利用OCR技术让用户能够轻松捕捉和复制屏幕上的任何文本,无论是PDF、网页还是视频中的内容。本文深入探讨了TRex的功能、使用场景和独特优势,为用户提供了全面的了解和使用指南。

TRexOCR文本提取菜单栏应用macOSGithub开源项目
TextSnatcher: 在 Linux 上轻松从图像中提取文本的开源工具

TextSnatcher: 在 Linux 上轻松从图像中提取文本的开源工具

TextSnatcher 是一款简单易用的 Linux 应用程序,可以快速从图像中识别和复制文本。本文将详细介绍 TextSnatcher 的功能、使用方法和技术特点,帮助您了解这个强大的开源 OCR 工具。

TextSnatcherOCR图像文字识别Linux应用开源软件Github开源项目
gImageReader: 一款强大的开源OCR软件

gImageReader: 一款强大的开源OCR软件

gImageReader是一款基于tesseract-ocr的简单而强大的图像文字识别(OCR)软件,支持PDF文档和图像的文字识别,具有多语言支持、批量处理、后处理等丰富功能。

gImageReaderOCR软件图像识别tesseract-ocrPDF处理Github开源项目
NormCap: 一款革命性的OCR屏幕截图工具

NormCap: 一款革命性的OCR屏幕截图工具

NormCap是一款基于OCR技术的屏幕截图工具,它能够捕获文本信息而非图像,为用户提供了一种全新的屏幕内容获取方式。这款开源软件支持多种语言,适用于Linux、macOS和Windows平台,具有离线使用、多显示器支持等多项特色功能。

NormCapOCR截图工具跨平台开源Github开源项目
Papermerge:开源文档管理系统的革新者

Papermerge:开源文档管理系统的革新者

Papermerge是一款专为数字档案设计的开源文档管理系统,它通过OCR技术提取文本,为扫描文档提供全文搜索功能,并提供现代化的用户界面,帮助用户高效组织和管理文档。

Papermerge DMS文档管理系统OCR全文搜索开源软件Github开源项目