脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - Python OpenCV机器学习之图像识别详解

Python OpenCV机器学习之图像识别详解

2022-09-05 10:36一个热爱学习的深度渣渣 Python

OpenCV中也提供了一些机器学习的方法,例如DNN等。本文将为大家详细介绍一下OpenCV中利用机器学习实现的一些图片识别功能:人脸识别、车牌识别等,感兴趣的可以了解一下

背景

OpenCV中也提供了一些机器学习的方法,例如DNN;本篇将简单介绍一下机器学习的一些应用,对比传统和前沿的算法,能从其中看出优劣;

 

一、人脸识别

主要有以下两种实现方法:

1、哈尔(Haar)级联法:专门解决人脸识别而推出的传统算法;

实现步骤:

创建Haar级联器;

导入图片并将其灰度化;

调用函数接口进行人脸识别;

函数原型:

detectMultiScale(img,scaleFactor,minNeighbors)

scaleFactor:缩放尺寸;

minNeighbors:最小像素值;

代码案例:

# 创建Haar级联器
facer = cv2.CascadeClassifier("./haarcascades/haarcascade_frontalface_default.xml")
# 导入人脸图片并灰度化
img = cv2.imread("p3.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 调用接口
faces = facer.detectMultiScale(gray, 1.1, 5)

for (x,y,w,h) in faces:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)

cv2.imshow("img", img)
cv2.waitKey()

Python OpenCV机器学习之图像识别详解

结论:Haar级联法对于完整脸部的检测效果还是不错的,但对于不完整脸部识别效果差,这可能也是传统算法的一个缺陷所在,泛化能力比较差;

拓展:Haar级联器还可以对脸部中细节特征进行识别

代码如下:

# 创建Haar级联器
facer = cv2.CascadeClassifier("./haarcascades/haarcascade_frontalface_default.xml")
eyer = cv2.CascadeClassifier("./haarcascades/haarcascade_eye.xml")
# 导入人脸图片并灰度化
img = cv2.imread("p3.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 调用接口
faces = facer.detectMultiScale(gray, 1.1, 5)
i = 0
for (x,y,w,h) in faces:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)
    ROI_img = img[y:y+h, x:x+w]
    eyes = eyer.detectMultiScale(ROI_img, 1.1, 5)
    for (x,y,w,h) in eyes:
        cv2.rectangle(ROI_img, (x,y), (x+w, y+h), (0,255,0), 2)
    i += 1
    name = "img"+str(i)
    cv2.imshow(name, ROI_img)
cv2.waitKey()

Python OpenCV机器学习之图像识别详解

总结:Haar级联器提供了多种脸部属性的识别,眼睛鼻子嘴巴都可以,但效果不一定那么准确;

 

二、车牌识别

结构:Haar+Tesseract车牌识别;

说明:Haar级联器仅用于定位车牌的位置,Tesseract用于提取其中的内容;

实现步骤:

1、Haar级联器定位车牌位置;

2、车牌预处理操作(二值化、形态学、滤波去噪、缩放);

3、调用Tesseract进行文字识别;

注意:这里需要预先安装Tesseract;

代码案例:

import pytesseract
# 创建Haar级联器
carer = cv2.CascadeClassifier("./haarcascades/haarcascade_russian_plate_number.xml")
# 导入人脸图片并灰度化
img = cv2.imread("chinacar.jpeg")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 调用接口 
cars = carer.detectMultiScale(gray, 1.1, 3)
for (x,y,w,h) in cars:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)
# 提取ROI
roi = gray[y:y+h, x:x+w]
# 二值化
ret, roi_bin = cv2.threshold(roi, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# 文字识别
pytesseract.pytesseract.tesseract_cmd = r"D:Tesseract_OCR	esseract.exe"
text = pytesseract.image_to_string(roi, lang="chi_sim+eng",config="--psm 8 --oem 3")
print(text)
cv2.putText(img, text, (20,100), cv2.FONT_HERSHEY_SIMPLEX, 2, (0,0,255), 3)
cv2.imshow("img", img)
cv2.waitKey()

Python OpenCV机器学习之图像识别详解

结论:车牌的位置检测比较准确,但Tesseract的识别并不那么准确,可能用ORC识别会准确一些;当然识别的准确率也和图像处理后比较模糊有关,做一些处理能够提升文字的识别率;

 

三、DNN图像分类

DNN为深度神经网络,并且是全连接的形式;

注意:OpenCV能够使用DNN模型,但并不能训练;

DNN使用步骤:

读取模型,得到网络结构;

读取数据(图片或视频)

将图片转成张量,送入网络;

模型输出结果;

函数原型:

导入模型:readNet(model,[config])

图像转张量:blobFromImage(image,scalefactor,size,mean,swapRB,crop)

送入网络:net.setInput(blob)

模型推理:net.forward()

代码案例:

# 导入模型
config = "./model/bvlc_googlenet.prototxt"
model = "./model/bvlc_googlenet.caffemodel"
net = dnn.readNetFromCaffe(config, model)

# 加载图片,转成张量
img = cv2.imread("./smallcat.jpeg")
blob = dnn.blobFromImage(img, 1.0, (224,224), (104,117,123))

# 模型推理
net.setInput(blob)
r = net.forward()
idxs = np.argsort(r[0])[::-1][:5]

# 分类结果展示
path = "./model/synset_words.txt"
with open(path, "rt") as f:
    classes = [x[x.find(" ")+1:]for x in f]
for (i, idx) in enumerate(idxs):
# 将结果展示在图像上
    if i == 0:
        text = "Label: {}, {:.2f}%".format(classes[idx],
            r[0][idx] * 100)
        cv2.putText(img, text, (5, 25),  cv2.FONT_HERSHEY_SIMPLEX,
            0.7, (0, 0, 255), 2)
# 显示图像
cv2.imshow("Image", img)
cv2.waitKey(0)

Python OpenCV机器学习之图像识别详解

结论:实际上有了模型之后,推理的步骤并不复杂,难点在于前处理与后处理;往往图像的处理上的错误,或者是对结果的处理问题,会导致结果不符,这是需要特别注意的;

到此这篇关于Python OpenCV机器学习之图像识别详解的文章就介绍到这了,更多相关OpenCV 图像识别内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/weixin_40620310/article/details/122688214

延伸 · 阅读

精彩推荐
  • PythonPython如何判断数独是否合法

    Python如何判断数独是否合法

    这篇文章给大家介绍了如何利用Python判断数独是否合法,对大家学习python有一定的参考借鉴价值,有需要的可以一起来看看。...

    Python教程网8202020-09-06
  • PythonPycharm开发Django项目创建ORM模型的问题

    Pycharm开发Django项目创建ORM模型的问题

    ORM,全称Object Relational Mapping,通过ORM我们可以通过类的方式去操作数据库,而不用再写原生的SQL语句,下面通过本文给大家介绍Pycharm开发Django项目ORM模型...

    白日梦想家UUC8482022-02-12
  • PythonPython 抓取微信公众号账号信息的方法

    Python 抓取微信公众号账号信息的方法

    搜狗微信搜索提供两种类型的关键词搜索,一种是搜索公众号文章内容,另一种是直接搜索微信公众号。这篇文章主要介绍了Python 抓取微信公众号账号信息...

    IT白鸽9782021-07-12
  • Pythonpandas中去除指定字符的实例

    pandas中去除指定字符的实例

    今天小编就为大家分享一篇pandas中去除指定字符的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    Pywin16252021-02-22
  • Python详解python破解zip文件密码的方法

    详解python破解zip文件密码的方法

    这篇文章主要介绍了python破解zip文件密码的方法,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下 ...

    阿优乐扬13682020-04-27
  • PythonPython判断telnet通不通的实例

    Python判断telnet通不通的实例

    今天小编就为大家分享一篇Python判断telnet通不通的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...

    Persistent_8652021-05-22
  • Python举例详解Python中的split()函数的使用方法

    举例详解Python中的split()函数的使用方法

    这篇文章主要介绍了举例详解Python中的split()函数的使用方法,split()函数的使用是Python学习当中的基础知识,通常用于将字符串切片并转换为列表,需要的朋友...

    脚本之家2672020-05-31
  • PythonPython实现的自定义多线程多进程类示例

    Python实现的自定义多线程多进程类示例

    这篇文章主要介绍了Python实现的自定义多线程多进程类,结合实例形式分析了Python多线程多进程的相关调用与使用操作技巧,需要的朋友可以参考下...

    Magicapprentice3772021-01-24