返回顶部
首页 > 资讯 > 后端开发 > Python >python——opencv入门(一)
  • 647
分享到

python——opencv入门(一)

入门pythonopencv 2023-01-31 02:01:34 647人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

1、 OpenCV的结构 和python一样,当前的OpenCV也有两个大版本,OpenCV2和OpenCV3。相比OpenCV2,OpenCV3提供了更强的功能和更多方便的特性。不过考虑到和深度学习框架的兼容性,以及上手安装的难

1、 OpenCV的结构

python一样,当前的OpenCV也有两个大版本,OpenCV2和OpenCV3。相比OpenCV2,OpenCV3提供了更强的功能和更多方便的特性。不过考虑到和深度学习框架的兼容性,以及上手安装的难度,这部分先以2为主进行介绍。

根据功能和需求的不同,OpenCV中的函数接口大体可以分为如下部分:

  • core:核心模块,主要包含了OpenCV中最基本的结构(矩阵,点线和形状等),以及相关的基础运算/操作。

  • imgproc:图像处理模块,包含和图像相关的基础功能(滤波,梯度,改变大小等),以及一些衍生的高级功能(图像分割,直方图,形态分析和边缘/直线提取等)。

  • highgui:提供了用户界面和文件读取的基本函数,比如图像显示窗口的生成和控制,图像/视频文件的io等。

如果不考虑视频应用,以上三个就是最核心和常用的模块了。针对视频和一些特别的视觉应用,OpenCV也提供了强劲的支持:

  • video:用于视频分析的常用功能,比如光流法(Optical Flow)和目标跟踪等。

  • calib3D:三维重建,立体视觉和相机标定等的相关功能。

  • features2d:二维特征相关的功能,主要是一些不受专利保护的,商业友好的特征点检测和匹配等功能,比如ORB特征。

  • object:目标检测模块,包含级联分类和Latent SVM

  • ml:机器学习算法模块,包含一些视觉中最常用的传统机器学习算法。

  • flann:最近邻算法库,Fast Library for Approximate
    Nearest Neighbors,用于在多维空间进行聚类和检索,经常和关键点匹配搭配使用。

  • gpu:包含了一些gpu加速的接口,底层的加速是CUDA实现。

  • photo:计算摄像学(Computational Photography)相关的接口,当然这只是个名字,其实只有图像修复和降噪而已。

  • stitching:图像拼接模块,有了它可以自己生成全景照片。

  • nonfree:受到专利保护的一些算法,其实就是SIFT和SURF。

  • contrib:一些实验性质的算法,考虑在未来版本中加入的。

  • legacy:字面是遗产,意思就是废弃的一些接口,保留是考虑到向下兼容。

  • ocl:利用OpenCL并行加速的一些接口。

  • superres:超分辨率模块,其实就是BTV-L1(Biliteral Total Variation – L1
    regularization)算法

  • viz:基础的3D渲染模块,其实底层就是著名的3D工具包VTK(Visualization Toolkit)。

从使用的角度来看,和OpenCV2相比,OpenCV3的主要变化是更多的功能和更细化的模块划分。

2、Python——opencv基础

2.1 图像的表示

已知单通道的灰度图像在计算机中的表示是一个8位无符号整形的矩阵,在oncv的c++代码中,表示图像有专门的结构cv::Mat,但python中有numpy这种强大的基础工具,所以该矩阵就用numpy的array表示,多通道就是红绿蓝(RGB)三通道。

这里写图片描述

2.2 基本处理

(1)读取图像:cv.imread()

可以按照不同模式读取,一般最常用到的是读取单通道灰度图,或者直接默认读取多通道

(2)储存图像:cv.imwrite()

import cv2
color_img=cv2.imread('4.jpg')
print(color_img.shape)

# 读取单通道
gray_img=cv2.imread('4.jpg',cv2.IMREAD_GRAYSCALE)
print(gray_img.shape)

#把单通道图像保存后,再读取,仍然是3通道,相当于将单通道复制到3个通道保存
cv2.imwrite('grayscale_4.jpg',gray_img)
reload_grayscale=cv2.imread('grayscale_4.jpg')
print(reload_grayscale.shape)

# 指定jpg质量,范围从1~100,默认95,值越高画质越好,文件越大
cv2.imwrite('anglababy.jpg',color_img,(cv2.IMWRITE_JPEG_QUALITY,20))

(2)缩放、裁剪、补边

  • 缩放:im.resize()

  • 裁剪:利用array下标截取实现

import cv2
img=cv2.imread('dog.jpg')

# 缩小为200x200的正方形
img_200x200=cv2.resize(img,(200,200))

# 不直接指定缩放后的大小,通过fx和fy指定缩放比例,0.5表示长宽各一半
# 插值方法默认为cv2.INTER_LINEAR,这里指定为最近邻插值
img_half=cv2.resize(img,(0,0),fx=0.5,fy=0.5,interpolation=cv2.INTER_NEAREST)

# 上下各贴50像素的黑边
img_add=cv2.copyMakeBorder(img,50,50,0,0,cv2.BORDER_CONSTANT,value=(0,0,0))

# 裁剪
patch_img=img[20:150,-180:-50]

cv2.imshow("image",img_200x200)
cv2.imshow("img_half",img_half)
cv2.imshow("img_add",img_add)
cv2.imshow("patch_img",patch_img)
cv2.waiTKEy(0)

(3)色调、明暗、直方图、Gamma曲线

比如可以通过HSV空间对色调和明暗进行调节。HSV空间是由美国的图形学专家A. R. Smith提出的一种颜色空间,HSV分别是色调(Hue),饱和度(Saturation)和明度(Value)。在HSV空间中进行调节就避免了直接在RGB空间中调节是还需要考虑三个通道的相关性。OpenCV中H的取值是[0, 180),其他两个通道的取值都是[0, 256),下面例子接着上面例子代码,通过HSV空间对图像进行调整:

import cv2

img=cv2.imread('mushroom.jpg')
# 通过cv2.cvtcolor把图像从RGB转到HSV
img_hsv=cv2.cvtColor(img,cv2.COLOR_BGR2HSV)

# H空间中,绿色比黄色值高,所以给每个像素+15,黄色的就会变绿
turn_green_hsv=img_hsv.copy()
turn_green_hsv[:,:,0]=(turn_green_hsv[:,:,0]+15)
turn_green_img=cv2.cvtColor(turn_green_hsv,cv2.COLOR_HSV2BGR)

cv2.imshow("turn_green_img",turn_green_img)

# 减小饱和度会让图像损失鲜艳,变得更灰
colorless_hsv=img_hsv.copy()
colorless_hsv[:,:,1]=0.5*colorless_hsv[:,:,1]
colorless_img=cv2.cvtColor(colorless_hsv,cv2.COLOR_HSV2BGR)
cv2.imshow("colorless_img",colorless_img)

# 减小为原来的一半
darker_hsv=img_hsv.copy()
darker_hsv[:,:,2]=0.5*darker_hsv[:,:,2]
darker_img=cv2.cvtColor(darker_hsv,cv2.COLOR_HSV2BGR)
cv2.imshow("darker_img",darker_img)

cv2.waitKey(0)

直方图:方便对图像的像素值分布了解更清晰,低的像素值表示暗的部分,高的值表示亮度大的部分,但是显示的时候可能就出现了暗部细节不足或者亮部细节丢失的情况。

Gamma变换:提升暗部细节,Gamma变换是矫正相机直接成像和人眼感受图像差别的一种常用手段,简单来说就是通过非线性变换让图像从对曝光强度的线性响应变得更接近人眼感受到的响应。

import numpy as np
import cv2
import matplotlib.pylab as plt
from mpl_toolkits.mplot3d import Axes3D

img=cv2.imread('4.jpg')

# 分通道计算每个通道的直方图
hist_b=cv2.calcHist([img],[0],None,[256],[0,256])
hist_g=cv2.calcHist([img],[1],None,[256],[0,256])
hist_r=cv2.calcHist([img],[2],None,[256],[0,256])

# Gamma变换的函数
def gamma_trans(img,gamma):
    # 先归一化到1,之后利用gamma作为指数求出新值,再还原
    gamma_table=[np.power(x/255.0,gamma)*255.0 for x in range(256)]
    gamma_table=np.round(np.array(gamma_table)).astype(np.uint8)

    # 用opencv的查表函数实现该映射
    return cv2.LUT(img,gamma_table)

# 执行Gamma变换,小于1的值让暗细节大量提升,同时亮部细节少量提升
img_corrected=gamma_trans(img,0.5)
cv2.imshow("img",img)
cv2.imshow("img_corrected",img_corrected)
# cv2.waitKey(0)

# 分通道计算Gamma矫正后的直方图
hist_b_corrected=cv2.calcHist([img_corrected],[0],None,[256],[0,256])
hist_g_corrected=cv2.calcHist([img_corrected],[1],None,[256],[0,256])
hist_r_corrected=cv2.calcHist([img_corrected],[2],None,[256],[0,256])

# 直方图可视化

fig=plt.figure()
pix_hists=[
    [hist_b,hist_g,hist_r],
    [hist_b_corrected,hist_g_corrected,hist_r_corrected]
]
pix_vals=range(256)
for sub_plt,pix_hist in zip([121,122],pix_hists):
    ax=fig.add_subplot(sub_plt,projection='3d')
    for c,z,channel_hist in zip(['b','g','r'],[20,10,0],pix_hist):
        cs=[c]*256
        ax.bar(pix_vals,channel_hist,zs=z,zdir='y',color=cs,alpha=0.618,
               edgecolor='none',lw=0)
    ax.set_xlabel('Pixel Values')
    ax.set_xlim([0,256])
    ax.set_ylabel('Channels')
    ax.set_zlabel('Counts')

plt.show()

这里写图片描述
这里写图片描述
这里写图片描述

(4)仿射变换

图像的仿射变换涉及到图像的形状位置角度的变化,是深度学习预处理中常到的功能,在此简单回顾一下。仿射变换具体到图像中的应用,主要是对图像的缩放,旋转,剪切,翻转和平移的组合。在OpenCV中,仿射变换的矩阵是一个2×3的矩阵,其中左边的2×2子矩阵是线性变换矩阵,右边的2×1的两项是平移项:

这里写图片描述

对于图像上的任一位置(x,y),仿射变换执行的是如下的操作:
这里写图片描述
需要注意的是,对于图像而言,宽度方向是x,高度方向是y,坐标的顺序和图像像素对应下标一致。所以原点的位置不是左下角而是右上角,y的方向也不是向上,而是向下。在OpenCV中实现仿射变换是通过仿射变换矩阵和cv2.warpAffine()这个函数:

import numpy as np
import cv2

img = cv2.imread('dog.jpg')

# 沿着横纵轴放大1.6倍,之后平移(-150,-240),最后沿原图大小截取,等效于剪裁并放大
M_crop_dog = np.array([
    [1.6, 0, -150],
    [0, 1.6, -240]
], dtype=np.float32)

# cv2.warpAffine(原始图像, 变换矩阵,变换后的图像大小)
img_dog = cv2.warpAffine(img, M_crop_dog,(400, 400))
cv2.imshow("img_dog", img_dog)


# x轴的剪切变换,逆时针旋转角度15°
theta=15*np.pi/180
M_shear=np.array([
    [1,np.tan(theta),0],
    [0,1,0]
],dtype=np.float32)

img_sheared=cv2.warpAffine(img,M_shear,(400,600))
cv2.imshow("img_sheared",img_sheared)

# 顺时针旋转,角度15°
M_rotate=np.array([
    [np.cos(theta),-np.sin(theta),0],
    [np.sin(theta),np.cos(theta),0]
],dtype=np.float32)

im_rotate=cv2.warpAffine(img,M_rotate,(400,600))
cv2.imshow("im_rotate",im_rotate)

# 旋转+缩放+旋转组合,可以通过SVD分解理解
M=np.array([
    [1,1.5,-400],
    [0.5,2,-100]
],dtype=np.float32)

img_transfORMed=cv2.warpAffine(img,M,(400,600))
cv2.imshow("img_transformed",img_transformed)

cv2.waitKey(0)

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

--结束END--

本文标题: python——opencv入门(一)

本文链接: https://lsjlt.com/news/185344.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • python——opencv入门(一)
    1、 OpenCV的结构 和Python一样,当前的OpenCV也有两个大版本,OpenCV2和OpenCV3。相比OpenCV2,OpenCV3提供了更强的功能和更多方便的特性。不过考虑到和深度学习框架的兼容性,以及上手安装的难...
    99+
    2023-01-31
    入门 python opencv
  • Python OpenCV快速入门教程
    目录OpenCV先决条件我们会在本文中涵盖7个主题读,写和显示图像imread():imshow():imwrite():读取视频并与网络摄像头集成句法调整大小和裁剪图像句法裁剪图像...
    99+
    2024-04-02
  • 一、python入门
    一、python介绍 介绍 python的创始人为吉多·范罗苏姆(Guido van Rossum)。1989年的圣诞节期间,Guido开始写能够解释Python语言语法的解释器。Python这个名字,来自Guido所挚爱的电视剧...
    99+
    2023-01-31
    入门 python
  • Python入门(一)
    1.编程语言:    机器代码-》微码变成-》高级语言    编译器[解释器]:把人类能够理解的,转换成机器能够理解的        编译器:必须转换成二进制代码才能运行        解释器:边解释[执行],边运行     python非...
    99+
    2023-01-31
    入门 Python
  • Python入门篇(一)
    python学习博客:http://www.cnblogs.com/haiyan123/p/8387770.html#lable1http://www.cnblogs.com/alex3714http://www.cnblogs.com/...
    99+
    2023-01-31
    入门篇 Python
  • 一篇文章带你顺利通过Python OpenCV入门阶段
    目录1. OpenCV 初识与安装2. OpenCV 模块简介3. OpenCV 图像读取,显示,保存4. 摄像头和视频读取,保存5. OpenCV 常用数据结构和颜色空间6. Op...
    99+
    2024-04-02
  • python计算机视觉OpenCV入门讲解
    目录前言一、什么是计算机视觉二、图片处理基础操作图片处理:读入图像图片处理:显示图像图片处理:图像保存三、图像处理入门基础图像成像原理介绍图像分类四、灰度图像五、彩色图像(RGB)六...
    99+
    2024-04-02
  • 《Python入门》第一个Python
    上一篇讲了《Python入门》Windows 7下Python Web开发环境搭建笔记,接下来讲一下Python语言Web服务的具体实现:第一个Python Web程序——简单的Web服务器。与其它Web后端语言不同,Python语言需...
    99+
    2023-01-31
    第一个 入门 Python
  • 第一章 python入门
    阅读目录:         1.变量    2.用户与程序交互    3.基本数据类型    4.格式化输出    5.基本运算符    6.流程控制之if....else    7.流程控制之while循环    8.流程控制之for循...
    99+
    2023-01-30
    入门 python
  • Python编程入门(一)
    Python编程入门(一)=========================================================================================概述:===============...
    99+
    2023-01-31
    入门 Python
  • python入门教程(一)
      我们依然不讲代码,而是先说命令行。   为什么命令行如此重要?之前说到,命令行是你和电脑对话的地方。你可以用句子的方式把信息发给电脑,电脑再以句子的方式给你回应。在编程领域,有些消息只能用命令行告诉电脑——或许是编程人员早就习惯了,或许...
    99+
    2023-01-31
    入门教程 python
  • OpenCV图像处理入门
    😊😊😊欢迎来到本博客😊😊😊 本次博客内容将继续讲解关于OpenCV的相关知识 🎉作者...
    99+
    2023-09-01
    opencv 图像处理 计算机视觉 人工智能 python
  • 【OpenCV入门】第一部分——图像处理基础
    本文结构 图像处理的基本操作读取图像imread() 显示图像imshow()waitKey()destroyAllWindows() 保存图像imwrite() 复制图像copy() 获取图像属性 像素...
    99+
    2023-08-30
    opencv 计算机视觉 python
  • Python-OpenCV深度学习入门示例详解
    目录0.前言1.计算机视觉中的深度学习简介1.1深度学习的特点1.2深度学习大爆发2.用于图像分类的深度学习简介3.用于目标检测的深度学习简介4.深度学习框架keras介绍与使用4....
    99+
    2024-04-02
  • 【文末送书】Python OpenCV从入门到精通
    文章目录 🍔简介opencv🌹内容简介🛸编辑推荐🎄导读🌺彩蛋 🍔简介openc...
    99+
    2024-01-21
    python opencv 开发语言
  • Python与AI之一_入门
    Python与Java, C, C++并列为全球4大最流行语言. 从C到C++,到Java再到Python, 细节越来越少, 让开发者把更多的精力放在”做什么”, 而不是”怎么做”. 早就听说Python容易, 但没想到这么容易, 机器学...
    99+
    2023-01-31
    入门 Python AI
  • python入门(一)pycharm的安
    python的来历:Python 是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido van Rossum于1989年发明,第一个公开发行版发行于1991年。Python是纯粹的自由软件, 源代码和解释器CPython遵循 GPL...
    99+
    2023-01-31
    入门 python pycharm
  • python计算机视觉OpenCV入门实例分析
    本文小编为大家详细介绍“python计算机视觉OpenCV入门实例分析”,内容详细,步骤清晰,细节处理妥当,希望这篇“python计算机视觉OpenCV入门实例分析”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。一...
    99+
    2023-07-02
  • python入门第一步,python怎样
    (1)人工智能这么火,0基础能学python吗? (2)python该怎么选择编辑器? (3)怎么搭建python运行环境? (4)python好学吗,怎么学? 人工智能时代的到来,很多文章说这么一句:“不会python,就不要说自己...
    99+
    2023-01-31
    入门 python
  • Python基础知识入门(一)
    Python基础知识入门(二) Python基础知识入门(三) Python基础知识入门(四) Python基础知识入门(五) 一、发展历程        Python的创始人为荷兰人吉多·范罗苏姆(Guido van Rossum)。1...
    99+
    2023-09-05
    开发语言 python 基础学习
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作