Tree Hole OCR 高效本地文本识别工具
Tree Hole OCR是一款基于Paddle OCR模型的本地文本识别工具。无需联网即可快速识别文字,支持PDF、图像和截图识别等多种功能。采用Java和JavaFX开发,具有良好的跨平台兼容性,适用于Mac OS X 12.6及以上系统。该工具依赖于DJL、PyTorch等深度学习框架,集成了OpenCV图像处理库。除基本文本识别外,还支持PDF识别和快捷键截图识别。项目开源,可在GitHub或Gitee上获取源码。
https://tree-hole-ocr-docs.vercel.app/
- 请勿在安装路径中包含中文字符;
- 本程序使用JavaFX开发,提供的安装包已包含Java。
- 从release下载最新版本并解压安装。
进入截图界面后,按住左键拖动选择要截取的区域; 完成选择后,可以微调所选区域:
选择完成后,按回车键
或空格键
,或双击鼠标左键确认选择;确认后,程序将自动对选中区域进行OCR文字识别。
图片
结果:
wget https://github.com/litongjava/tools-ocr/releases/download/model-ppocr-v4/ch_PP-OCRv4_rec_infer-onnx.zip
wget https://github.com/litongjava/tools-ocr/releases/download/model-ppocr-v4/ch_PP-OCRv4_det_infer-onnx.zip
解压模型
mkdir models/ch_PP-OCRv4_rec_infer
mkdir models/ch_PP-OCRv4_det_infer
unzip /Users/mac/Downloads/ch_PP-OCRv4_rec_infer-onnx.zip -d models/ch_PP-OCRv4_rec_infer
unzip /Users/mac/Downloads/ch_PP-OCRv4_det_infer-onnx.zip -d models/ch_PP-OCRv4_det_infer
您可以下载代码并在本地构建。构建命令如下: Windows
mkdir target\jfx\app
cp -r models target\jfx\app
mvn jfx:native -DskipTests -f pom.xml
macOS
rm -rf target/jfx/app mkdir -p target/jfx/app cp -r models target/jfx/app mvn jfx:native -DskipTests -f pom.xml
cd treehole.app/Contents/java/logs
由于监听了截图快捷键,MAC需要相应的权限设置,如下图所示: