首页 > 资讯 > 后端开发 > Python >PythonOpenCV机器学习之图像识别详解

381

分享到

PythonOpenCV机器学习之图像识别详解

2024-04-02 19:04:59 381人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

目录背景一、人脸识别二、车牌识别三、DNN图像分类背景 OpenCV中也提供了一些机器学习的方法，例如DNN；本篇将简单介绍一下机器学习的一些应用，对比传统和前沿的算法，能从其中看出

背景

OpenCV中也提供了一些机器学习的方法，例如DNN；本篇将简单介绍一下机器学习的一些应用，对比传统和前沿的算法，能从其中看出优劣；

一、人脸识别

主要有以下两种实现方法：

1、哈尔（Haar）级联法：专门解决人脸识别而推出的传统算法；

实现步骤：

创建Haar级联器；

导入图片并将其灰度化；

调用函数接口进行人脸识别；

函数原型：

detectMultiScale（img，scaleFactor，minNeighbors）

scaleFactor：缩放尺寸；

minNeighbors：最小像素值；

代码案例：

# 创建Haar级联器
facer = cv2.CascadeClassifier('./haarcascades/haarcascade_frontalface_default.xml')
# 导入人脸图片并灰度化
img = cv2.imread('p3.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 调用接口
faces = facer.detectMultiScale(gray, 1.1, 5)

for (x,y,w,h) in faces:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)

cv2.imshow('img', img)
cv2.waiTKEy()

结论：Haar级联法对于完整脸部的检测效果还是不错的，但对于不完整脸部识别效果差，这可能也是传统算法的一个缺陷所在，泛化能力比较差；

拓展：Haar级联器还可以对脸部中细节特征进行识别

代码如下：

# 创建Haar级联器
facer = cv2.CascadeClassifier('./haarcascades/haarcascade_frontalface_default.xml')
eyer = cv2.CascadeClassifier('./haarcascades/haarcascade_eye.xml')
# 导入人脸图片并灰度化
img = cv2.imread('p3.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 调用接口
faces = facer.detectMultiScale(gray, 1.1, 5)
i = 0
for (x,y,w,h) in faces:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)
    ROI_img = img[y:y+h, x:x+w]
    eyes = eyer.detectMultiScale(ROI_img, 1.1, 5)
    for (x,y,w,h) in eyes:
        cv2.rectangle(ROI_img, (x,y), (x+w, y+h), (0,255,0), 2)
    i += 1
    name = 'img'+str(i)
    cv2.imshow(name, ROI_img)
cv2.waitKey()

总结：Haar级联器提供了多种脸部属性的识别，眼睛鼻子嘴巴都可以，但效果不一定那么准确；

二、车牌识别

结构：Haar+Tesseract车牌识别；

说明：Haar级联器仅用于定位车牌的位置，Tesseract用于提取其中的内容；

实现步骤：

1、Haar级联器定位车牌位置；

2、车牌预处理操作（二值化、形态学、滤波去噪、缩放）；

3、调用Tesseract进行文字识别；

注意：这里需要预先安装Tesseract；

代码案例：

import pytesseract
# 创建Haar级联器
carer = cv2.CascadeClassifier('./haarcascades/haarcascade_russian_plate_number.xml')
# 导入人脸图片并灰度化
img = cv2.imread('chinacar.jpeg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 调用接口 
cars = carer.detectMultiScale(gray, 1.1, 3)
for (x,y,w,h) in cars:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)
# 提取ROI
roi = gray[y:y+h, x:x+w]
# 二值化
ret, roi_bin = cv2.threshold(roi, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# 文字识别
pytesseract.pytesseract.tesseract_cmd = r"D:\Tesseract_OCR\tesseract.exe"
text = pytesseract.image_to_string(roi, lang='chi_sim+eng',config='--psm 8 --oem 3')
print(text)
cv2.putText(img, text, (20,100), cv2.FONT_HERSHEY_SIMPLEX, 2, (0,0,255), 3)
cv2.imshow('img', img)
cv2.waitKey()

结论：车牌的位置检测比较准确，但Tesseract的识别并不那么准确，可能用ORC识别会准确一些；当然识别的准确率也和图像处理后比较模糊有关，做一些处理能够提升文字的识别率；

三、DNN图像分类

DNN为深度神经网络，并且是全连接的形式；

注意：OpenCV能够使用DNN模型，但并不能训练；

DNN使用步骤：

读取模型，得到网络结构；

读取数据（图片或视频）

将图片转成张量，送入网络；

模型输出结果；

函数原型：

导入模型：readNet（model，[config]）

图像转张量：blobFromImage（image，scalefactor，size，mean，swapRB，crop）

送入网络：net.setInput（blob）

模型推理：net.forward（）

代码案例：

# 导入模型
config = "./model/bvlc_Googlenet.prototxt"
model = "./model/bvlc_googlenet.caffemodel"
net = dnn.readNetFromCaffe(config, model)

# 加载图片，转成张量
img = cv2.imread('./smallcat.jpeg')
blob = dnn.blobFromImage(img, 1.0, (224,224), (104,117,123))

# 模型推理
net.setInput(blob)
r = net.forward()
idxs = np.argsort(r[0])[::-1][:5]

# 分类结果展示
path = './model/synset_Words.txt'
with open(path, 'rt') as f:
    classes = [x[x.find(" ")+1:]for x in f]
for (i, idx) in enumerate(idxs):
# 将结果展示在图像上
    if i == 0:
        text = "Label: {}, {:.2f}%".fORMat(classes[idx],
            r[0][idx] * 100)
        cv2.putText(img, text, (5, 25),  cv2.FONT_HERSHEY_SIMPLEX,
            0.7, (0, 0, 255), 2)
# 显示图像
cv2.imshow("Image", img)
cv2.waitKey(0)

结论：实际上有了模型之后，推理的步骤并不复杂，难点在于前处理与后处理；往往图像的处理上的错误，或者是对结果的处理问题，会导致结果不符，这是需要特别注意的；

到此这篇关于python OpenCV机器学习之图像识别详解的文章就介绍到这了,更多相关OpenCV 图像识别内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

--结束END--

本文标题: PythonOpenCV机器学习之图像识别详解

本文链接: https://lsjlt.com/news/163880.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

PythonOpenCV机器学习之图像识别详解

目录背景一、人脸识别二、车牌识别三、DNN图像分类背景 OpenCV中也提供了一些机器学习的方法，例如DNN；本篇将简单介绍一下机器学习的一些应用，对比传统和前沿的算法，能从其中看出...

99+

2024-04-02
PythonOpenCV学习之图像滤波详解

目录背景一、卷积相关概念二、卷积实战三、均值滤波四、高斯滤波五、中值滤波六、双边滤波七、Sobel算子八、Scharr算子九、拉普拉斯算子十、Canny算法背景图像滤波的作用简单来...

99+

2024-04-02
PythonOpenCV学习之图像形态学

目录背景一、图像二值化二、自适应阈值三、腐蚀四、卷积核获取五、膨胀六、开运算七、闭运算八、形态学梯度九、顶帽运算十、黑帽运算总结背景形态学处理方法是基于对二进制图像进行处理的，卷积...

99+

2024-04-02
OpenCV图像识别之相机校准Camera Calibration学习

目录目标基础径向变形代码开始校准不畸变重投影误差|Re-projection Error目标在本节中，将学习由相机引起的失真类型如何找到相机的固有和非固有特性如何基于这些特性使图...

99+

2023-05-19

OpenCV图像识别相机校准 OpenCV Camera Calibration
Pythonopencv图像基本操作学习之灰度图转换

把今天的学习的opencv知识先记录一下！运行环境是：pycharm 话不多说，献上代码再说： import cv2 # opencv读取的格式是BGR import matpl...

99+

2023-02-16

python opencv图片转为灰度图 opencv灰度图转换
PythonOpenCV图像处理之图像滤波特效详解

目录1 分类2 邻域滤波2.1 线性滤波2.2 非线性滤波3 频域滤波3.1 低通滤波3.2 高通滤波1 分类图像滤波按图像域可分为两种类型：邻域滤波(Spatial Domai...

99+

2024-04-02
OpenCV图像识别之姿态估计Pose Estimation学习

目录目标基础绘制立方体目标在本章中，将学习利用calib3d模块在图像中创建一些3D效果基础在上一节相机校准中，了解了相机矩阵、失真系数等。给定图案图像，可以利用以上信息来计...

99+

2023-05-19

OpenCV图像识别姿态估计 OpenCV Pose Estimation
PythonOpenCV实战之与机器学习的碰撞

目录0.前言1.机器学习简介1.1监督学习1.2无监督学习1.3半监督学习2.K均值(K-Means)聚类2.1K-Means聚类示例3.K最近邻3.1K最近邻示例4.支持向量机4....

99+

2024-04-02
OpenCV学习之图像梯度算子详解

目录1.Sobel算子2.Scharr算子3.laplacian算子本文是OpenCV图像视觉入门之路的第12篇文章，本文详细的介绍了图像梯度算子的各种操作，例如：Sobel算子Sc...

99+

2023-02-15

OpenCV图像梯度算子 OpenCV 算子 OpenCV图像
PythonOpenCV学习之特征点检测与匹配详解

目录背景一、Harris角点二、Shi-Tomasi角点检测三、SIFT关键点四、SIFT描述子五、SURF六、ORB七、暴力特征匹配（BF）八、FLANN特征匹配九、图像查找总结背...

99+

2024-04-02
C++OpenCV学习之图像金字塔与图像融合详解

目录1 金字塔2 什么是图像金字塔？3 图像金字塔有什么用？4 OpenCV实战图像金字塔1 金字塔平时你听到、见到的金字塔是什么样的？这样？还是这样？实际上除了这些，还...

99+

2024-04-02
深度学习详解之初试机器学习

机器学习可应用在各个方面，本篇将在系统性进入机器学习方向前，初步认识机器学习，利用线性回归预测波士顿房价；原理简介利用线性回归最简单的形式预测房价，只需要把它当做是一次线性函数y...

99+

2024-04-02
PHP学习笔记：人脸识别与图像处理

前言：随着人工智能技术的发展，人脸识别和图像处理成为了热门话题。在实际应用中，人脸识别与图像处理多用于安全监控、人脸解锁、卡牌比对等方面。而PHP作为一种常用的服务器端脚本语言，也可以用来实现人脸识别与图像处理的相关功能。本篇文章将带你了解...

99+

2023-10-21

人脸识别图像处理 PHP
OpenCV学习之图像的叠加与混合详解

目录1.图像叠加2.图像混合本文是OpenCV图像视觉入门之路的第9篇文章，本文详细的在图像上面进行了图像叠加图像混合等操作。 1.图像叠加图片叠加一般加入水印用的特别多，比如视...

99+

2023-02-15

OpenCV图像叠加 OpenCV图像混合 OpenCV图像
OpenCV学习之图像的分割与修复详解

目录背景一、分水岭法二、GrabCut法三、MeanShift法四、MOG前景背景分离法五、拓展方法六、图像修复总结背景图像分割本质就是将前景目标从背景中分离出来。在当前的实际项目...

99+

2024-04-02
机器学习python实战之手写数字识别

看了上一篇内容之后，相信对K近邻算法有了一个清晰的认识，今天的内容——手写数字识别是对上一篇内容的延续，这里也是为了自己能更熟练的掌握k-NN算法。我们有大约2000个训练样本和1000个左右测试样本，训...

99+

2022-06-04

实战机器数字
Pytorch实现图像识别之数字识别(附详细注释)

使用了两个卷积层加上两个全连接层实现本来打算从头手撕的，但是调试太耗时间了，改天有时间在从头写一份详细过程看代码注释，参考了下一个博主的文章，但是链接没注意关了找不到了，博主看到...

99+

2024-04-02
机器学习之基础知识（全）

目录 1.机器学习概述 1.1 人工智能概述 1.1.1 人工智能使用场景 1.1.2 人工智能小案例 1.2 人工智能发展历程 1.2.1 图灵测试 1.2.2 发展历程 1.2.3 小结 1.3 人工智能主要分支 1.3.1 人工智能、...

99+

2023-08-31

机器学习
OpenCV学习之图像加噪与滤波的实现详解

目录一、实验内容二、实验环境和配置三、实验原理及操作1. 添加噪声2.噪声二值化3. 滤波处理四、实验结果2.椒盐噪声二值图与白噪声二值图3.椒盐噪声处理图经处理后图像4.白噪声处理...

99+

2023-02-16

OpenCV图像加噪滤波 OpenCV图像加噪 OpenCV图像滤波 OpenCV图像
Python基于ImageAI实现图像识别详解

目录背景简介图像预测算法引入目标检测图像目标检测视频目标检测背景简介 ImageAI是一个面向计算机视觉编程的Python库，支持最先进的机器学习算法。主要图像预测，物体检测，视频对...

99+

2023-02-01

Python ImageAI图像识别 Python 图像识别 Python ImageAI