网站菜单

OpenCV实战练习(1)——信用卡检测

输出结果如下:

总结:

  • 识别数字的轮廓时,使用cv2.RETR_EXTERNAL寻找外轮廓效果最好。
  • 创建字典digits = {}来储存模板里的数字。
  • 针对不同情况,使用不同大小的卷积核进行闭操作填充空隙。
  • resize大小,让模板数字与样例数字一样大,好进行模板匹配。
  • 通过礼帽操作来突出明亮区域。
  • sobel算子边缘检测后使用归一化提升处理效果。
  • 使用THRESH_OTSU自动寻找合适的阈值。

代码:

import cv2
import argparse
import numpy as np
import myutils

def cv_show(name, img):
    cv2.imshow(name,img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

#添加参数
ap = argparse.ArgumentParser()
ap.add_argument("-i", "--image", required=True, help="path to input image")
ap.add_argument("-t", "--template", required=True, help="path to template")
args = vars(ap.parse_args())

#检查是否成功载入模板与卡图像
img = cv2.imread(args["template"])
cv_show('img', img)


#转灰度图
ref = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv_show('ref', ref)
#转二值图
ref = cv2.threshold(ref, 127, 255, cv2.THRESH_BINARY_INV)[1]
cv_show('ref', ref)

#轮廓检测,不要忘记先copy一下原图。然后使用cv2.RETR_EXTERNAL只检测外轮廓。返回的list中每一个元素都是一个轮廓
ref_, refCnts, hierarchy = cv2.findContours(ref.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cv2.drawContours(img, refCnts, -1, (0, 0, 255), 3)
cv_show('img', img)
print(np.array(refCnts).shape)
#排序完的轮廓,从左到右,从上到下,并存到字典里
refCnts = myutils.sort_contours(refCnts, method="left-to-right")[0]
digits = {}

#遍历每一个轮廓
for (i, c) in enumerate(refCnts):
    # 计算外接矩形并且resize成合适大小
    (x, y, w, h) = cv2.boundingRect(c)
    roi = ref[y:y+h, x:x+w]
    roi = cv2.resize(roi, (57, 88))
    #每一个数字对应一个模板
    digits[i] = roi

#初始化卷积核
rectKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9, 3))
sqKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))

#读取卡图像
img2 = cv2.imread(args["image"])
cv_show('img2', img2)

#resize大小,转灰度图
img2 = myutils.resize(img2, width=300)
gray = cv2.cvtColor(img2, cv2.COLOR_BGR2GRAY)
cv_show('gray', gray)

#礼帽操作,突出明亮区域
tophat = cv2.morphologyEx(gray, cv2.MORPH_TOPHAT, rectKernel)
cv_show('tophat', tophat)

#sobel算子边缘检测,使用横向,归一化
gradX = cv2.Sobel(tophat, ddepth= cv2.CV_32F, dx= 1, dy= 0, ksize= -1)
gradX = np.absolute(gradX)
(minVal, maxVal) = (np.min(gradX), np.max(gradX))
gradX = (255* ((gradX-minVal)/(maxVal-minVal)))
gradX = gradX.astype("uint8")

print(np.array(gradX).shape)
cv_show('gradX', gradX)

#进行闭操作,将数字连在一起
gradX = cv2.morphologyEx(gradX, cv2.MORPH_CLOSE, rectKernel)
cv_show('gradX', gradX)

#进行二值处理,THRESH_OTSU自动寻找合适的阈值
thresh = cv2.threshold(gradX, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
cv_show('thresh', thresh)

#再进行一次闭操作
thresh = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, sqKernel)
cv_show('thresh', thresh)

#计算轮廓
thresh_, threshCnts, hierarchy = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = threshCnts
cur_image = img2.copy()
cv2.drawContours(cur_image, cnts, -1, (0, 0, 255), 3)
cv_show('img', cur_image)

locs = []
#过滤轮廓
#遍历轮廓
for (i, c) in enumerate(cnts):
    #计算外接矩形
    (x, y, w, h) = cv2.boundingRect(c)
    #计算矩形比例
    ar = w / float(h)
    #如果比例合适,存下来
    if ar > 2.5 and ar < 4.0:
        if (w > 40 and w < 55) and (h > 10 and h < 20):
            locs.append((x, y, w, h))
#将符合的轮廓从左到右排序
locs = sorted(locs, key=lambda x:x[0])
output = []

#遍历轮廓中的每一个数字
for (i, (gX, gY, gW, gH)) in enumerate (locs):
    groupOutPut = []
    #根据坐标提取每一个组,扩大一点范围
    group = gray[gY -5:gY+gH+5, gX-5:gX+gW+5]
    cv_show('group', group)
    #预处理,二值
    group = cv2.threshold(group, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
    cv_show('group', group)
    #计算每一组轮廓,并排序
    group_, digitCnts, hierarchy = cv2.findContours(group.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    digitCnts = myutils.sort_contours(digitCnts, method="left-to-right")[0]

    #计算每一组中的每一个数值
    for c in digitCnts:
        #找到当前数值的轮廓,resize到合适的大小。与前面的模板一样
        (x, y, w, h) = cv2.boundingRect(c)
        roi = group[y:y+h, x:x+w]
        roi = cv2.resize(roi, (57, 88))
        cv_show('roi', roi)
        #计算匹配得分
        scores = []
        #在模板中计算每一个得分
        for (digit, digitROI) in digits.items():
            #模板匹配,找到最大score(根据算法来,可能要最小)
            result = cv2.matchTemplate(roi, digitROI, cv2.TM_CCOEFF)
            (_, score, _, _) = cv2.minMaxLoc(result)
            scores.append(score)
        #得到最后输出数字
        groupOutPut.append(str(np.argmax(scores)))

    #画框,写出数字
    cv2.rectangle(img2, (gX-5, gY-5), (gX+gW+5, gY+gH+5), (0, 0, 255), 1)
    cv2.putText(img2, "".join(groupOutPut), (gX, gY-15), cv2.FONT_HERSHEY_SIMPLEX, 0.65, (0, 0, 255), 2)
    output.extend(groupOutPut)
#打印结果

cv2.imshow("img2", img2)
cv2.waitKey(0)
显示评论 (0)

文章评论

相关推荐

Yolov5_Seg输出解析

通过矩阵乘法(在代码中称为“matmul”)来计算分割掩码的原因,主要与实例分割网络(例如 YOLOv5 Segmentation)的实现方式有关。这种方法实际上是一种高效的特征图与目标分割系数组合的…

Ubuntu交叉编译Python

在 Ubuntu 上交叉编译 Python 的流程通常用于为不同平台生成可执行文件(如 ARM、MIPS 等)。以下是一般的操作步骤: 1. 安装必要的依赖工具 首先,确保已经安装了编译所需的工具和依…

此文章禁止复制~