ddddocr:一款强大的通用验证码识别OCR工具

ddddocr简介

ddddocr是由GitHub用户sml2h3开发的一款开源的通用验证码识别OCR(光学字符识别)工具。它主要用于识别各种类型的验证码图片,包括数字、字母、中文等。ddddocr采用深度学习技术,通过大量随机生成的数据进行训练,具有较高的识别准确率。

主要特性

ddddocr具有以下几个主要特性:

易于使用:安装简单,使用方便,仅需几行代码即可完成验证码识别。
识别准确率高:通过大量数据训练,对常见验证码类型的识别准确率较高。
支持多种验证码类型:可识别数字、字母、中文等多种类型的验证码。
目标检测功能:可以检测出图像中的目标位置。
滑块验证码检测:内置两种算法,可以检测滑块验证码。
开源免费:项目完全开源,可以免费使用。

安装和环境要求

ddddocr支持Windows、Linux和MacOS等主流操作系统,要求Python版本3.6及以上。可以通过pip直接安装:

pip install ddddocr

对于Windows用户,可能需要安装VC运行库。

基本使用方法

ddddocr的基本使用非常简单,以下是一个简单的示例:

import ddddocr

ocr = ddddocr.DdddOcr()

with open("captcha.jpg", "rb") as f:
    image = f.read()
    
result = ocr.classification(image)
print(result)

这段代码会读取名为"captcha.jpg"的验证码图片,并输出识别结果。

高级功能

除了基本的验证码识别功能,ddddocr还提供了一些高级功能:

1. 目标检测

ddddocr可以检测图像中的目标位置,返回目标的边界框坐标。使用方法如下:

import ddddocr
import cv2

det = ddddocr.DdddOcr(det=True)

with open("test.jpg", 'rb') as f:
    image = f.read()

bboxes = det.detection(image)
print(bboxes)

im = cv2.imread("test.jpg")

for bbox in bboxes:
    x1, y1, x2, y2 = bbox
    im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)

cv2.imwrite("result.jpg", im)

2. 滑块验证码检测

ddddocr内置了两种算法用于检测滑块验证码。第一种算法通过滑块图像的边缘在背景图中计算找到相对应的坑位:

det = ddddocr.DdddOcr(det=False, ocr=False)

with open('target.png', 'rb') as f:
    target_bytes = f.read()

with open('background.png', 'rb') as f:
    background_bytes = f.read()

res = det.slide_match(target_bytes, background_bytes)

print(res)

第二种算法适用于滑块图无背景的情况:

det = ddddocr.DdddOcr(det=False, ocr=False)

with open('slider.png', 'rb') as f:
    slider_bytes = f.read()

with open('background.png', 'rb') as f:
    background_bytes = f.read()

res = det.slide_match(slider_bytes, background_bytes, simple_target=True)

print(res)