返回顶部
首页 > 资讯 > 精选 >Opencv实现眼睛控制鼠标的案例分析
  • 714
分享到

Opencv实现眼睛控制鼠标的案例分析

2023-06-29 05:06:55 714人浏览 泡泡鱼
摘要

这篇文章主要讲解了“OpenCV实现眼睛控制鼠标的案例分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Opencv实现眼睛控制鼠标的案例分析”吧!在开始项目之前,我们需要引入第三方库。#&

这篇文章主要讲解了“OpenCV实现眼睛控制鼠标的案例分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Opencv实现眼睛控制鼠标的案例分析”吧!

在开始项目之前,我们需要引入第三方库。

# For monitoring WEB camera and perfORMing image minipulationsimport cv2# For performing array operationsimport numpy as np# For creating and removing directoriesimport osimport shutil# For recognizing and performing actions on mouse pressesfrom pynput.mouse import Listener

首先让我们了解一下Pynput的Listener工作原理。pynput.mouse.Listener创建一个后台线程,该线程记录鼠标的移动和鼠标的点击。这是一个简化代码,当你们按下鼠标时,它会打印鼠标的坐标:

from pynput.mouse import Listenerdef on_click(x, y, button, pressed):"""  Args:    x: the x-coordinate of the mouse    y: the y-coordinate of the mouse    button: 1 or 0, depending on right-click or left-click    pressed: 1 or 0, whether the mouse was pressed or released  """if pressed:print (x, y)with Listener(on_click = on_click) as listener:  listener.join()

现在,为了实现我们的目的,让我们扩展这个框架。但是,我们首先需要编写裁剪眼睛边界框的代码。我们稍后将在on_click函数内部调用此函数。我们使用Haar级联对象检测来确定用户眼睛的边界框。你们可以在此处下载检测器文件,让我们做一个简单的演示来展示它是如何工作的:

import cv2# Load the cascade classifier detection objectcascade = cv2.CascadeClassifier("haarcascade_eye.xml")# Turn on the web cameravideo_capture = cv2.VideoCapture(0)# Read data from the web camera (get the frame)_, frame = video_capture.read()# Convert the image to grayscalegray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# Predict the bounding box of the eyesboxes = cascade.detectMultiScale(gray, 1.3, 10)# Filter out images taken from a bad angle with errors# We want to make sure both eyes were detected, and nothing elseif len(boxes) == 2:eyes = []for box in boxes:    # Get the rectangle parameters for the detected eyex, y, w, h = box    # Crop the bounding box from the frameeye = frame[y:y + h, x:x + w]    # Resize the crop to 32x32eye = cv2.resize(eye, (32, 32))    # Normalizeeye = (eye - eye.min()) / (eye.max() - eye.min())    # Further crop to just around the eyeballeye = eye[10:-10, 5:-5]    # Scale between [0, 255] and convert to int datatypeeye = (eye * 255).astype(np.uint8)    # Add the current eye to the list of 2 eyeseyes.append(eye)  # Concatenate the two eye images into oneeyes = np.hstack(eyes)

现在,让我们使用此知识来编写用于裁剪眼睛图像的函数。首先,我们需要一个辅助函数来进行标准化:

def normalize(x):  minn, maxx = x.min(), x.max()return (x - minn) / (maxx - minn)

这是我们的眼睛裁剪功能。如果发现眼睛,它将返回图像。否则,它返回None:

def scan(image_size=(32, 32)):_, frame = video_capture.read()gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)boxes = cascade.detectMultiScale(gray, 1.3, 10)if len(boxes) == 2:eyes = []for box in boxes:x, y, w, h = boxeye = frame[y:y + h, x:x + w]eye = cv2.resize(eye, image_size)eye = normalize(eye)eye = eye[10:-10, 5:-5]eyes.append(eye)return (np.hstack(eyes) * 255).astype(np.uint8)else:return None

现在,让我们来编写我们的自动化,该自动化将在每次按下鼠标按钮时运行。(假设我们之前已经root在代码中将变量定义为我们要存储图像的目录):

def on_click(x, y, button, pressed):# If the action was a mouse PRESS (not a RELEASE)if pressed:# Crop the eyes    eyes = scan()# If the function returned None, something went wrongif not eyes is None:# Save the image      filename = root + "{} {} {}.jpeg".format(x, y, button)      cv2.imwrite(filename, eyes)

现在,我们可以回忆起pynput的实现Listener,并进行完整的代码实现:

import cv2import numpy as npimport osimport shutilfrom pynput.mouse import Listener  root = input("Enter the directory to store the images: ")if os.path.isdir(root):  resp = ""while not resp in ["Y", "N"]:    resp = input("This directory already exists. If you continue, the contents of the existing directory will be deleted. If you would still like to proceed, enter [Y]. Otherwise, enter [N]: ")if resp == "Y":     shutil.rmtree(root)else:    exit()os.mkdir(root)  # Normalization helper functiondef normalize(x):  minn, maxx = x.min(), x.max()return (x - minn) / (maxx - minn)  # Eye cropping functiondef scan(image_size=(32, 32)):  _, frame = video_capture.read()  gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)  boxes = cascade.detectMultiScale(gray, 1.3, 10)if len(boxes) == 2:    eyes = []for box in boxes:      x, y, w, h = box      eye = frame[y:y + h, x:x + w]      eye = cv2.resize(eye, image_size)      eye = normalize(eye)      eye = eye[10:-10, 5:-5]      eyes.append(eye)return (np.hstack(eyes) * 255).astype(np.uint8)else:return None  def on_click(x, y, button, pressed):# If the action was a mouse PRESS (not a RELEASE)if pressed:# Crop the eyes    eyes = scan()# If the function returned None, something went wrongif not eyes is None:# Save the image      filename = root + "{} {} {}.jpeg".format(x, y, button)      cv2.imwrite(filename, eyes)  cascade = cv2.CascadeClassifier("haarcascade_eye.xml")video_capture = cv2.VideoCapture(0)  with Listener(on_click = on_click) as listener:  listener.join()

运行此命令时,每次单击鼠标(如果两只眼睛都在视线中),它将自动裁剪网络摄像头并将图像保存到适当的目录中。图像的文件名将包含鼠标坐标信息,以及它是右击还是左击。

这是一个示例图像。在此图像中,我在分辨率为2560x1440的监视器上在坐标(385,686)上单击鼠标左键:

Opencv实现眼睛控制鼠标的案例分析

级联分类器非常准确,到目前为止,我尚未在自己的数据目录中看到任何错误。现在,让我们编写用于训练神经网络的代码,以给定你们的眼睛图像来预测鼠标的位置。

import numpy as npimport osimport cv2import pyautoguifrom Tensorflow.keras.models import *from tensorflow.keras.layers import *from tensorflow.keras.optimizers import *

现在,让我们添加级联分类器:

cascade = cv2.CascadeClassifier("haarcascade_eye.xml")video_capture = cv2.VideoCapture(0)

正常化:

def normalize(x):  minn, maxx = x.min(), x.max()return (x - minn) / (maxx - minn)

捕捉眼睛:

def scan(image_size=(32, 32)):_, frame = video_capture.read()gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)boxes = cascade.detectMultiScale(gray, 1.3, 10)if len(boxes) == 2:eyes = []for box in boxes:x, y, w, h = boxeye = frame[y:y + h, x:x + w]eye = cv2.resize(eye, image_size)eye = normalize(eye)eye = eye[10:-10, 5:-5]eyes.append(eye)return (np.hstack(eyes) * 255).astype(np.uint8)else:return None

让我们定义显示器的尺寸。你们必须根据自己的计算机屏幕的分辨率更改以下参数:

# Note that there are actually 2560x1440 pixels on my screen# I am simply recording one less, so that when we divide by these# numbers, we will normalize between 0 and 1. Note that mouse# coordinates are reported starting at (0, 0), not (1, 1)width, height = 2559, 1439

现在,让我们加载数据(同样,假设你们已经定义了root)。我们并不在乎是单击鼠标右键还是单击鼠标左键,因为我们的目标只是预测鼠标的位置:

filepaths = os.listdir(root)X, Y = [], []for filepath in filepaths:x, y, _ = filepath.split(' ')x = float(x) / widthy = float(y) / heightX.append(cv2.imread(root + filepath))Y.append([x, y])X = np.array(X) / 255.0Y = np.array(Y)print (X.shape, Y.shape)

让我们定义我们的模型架构

model = Sequential()model.add(Conv2D(32, 3, 2, activation = 'relu', input_shape = (12, 44, 3)))model.add(Conv2D(64, 2, 2, activation = 'relu'))model.add(Flatten())model.add(Dense(32, activation = 'relu'))model.add(Dense(2, activation = 'sigmoid'))model.compile(optimizer = "adam", loss = "mean_squared_error")model.summary()

这是我们的摘要:

Opencv实现眼睛控制鼠标的案例分析

接下来的任务是训练模型。我们将在图像数据中添加一些噪点:

epochs = 200for epoch in range(epochs):  model.fit(X, Y, batch_size = 32)

现在让我们使用我们的模型来实时移动鼠标。请注意,这需要大量数据才能正常工作。但是,作为概念证明,你们会注意到,实际上只有200张图像,它确实将鼠标移到了你们要查看的常规区域。当然,除非你们拥有更多的数据,否则这是不可控的。

while True:  eyes = scan()if not eyes is None:      eyes = np.expand_dims(eyes / 255.0, axis = 0)      x, y = model.predict(eyes)[0]      pyautogui.moveTo(x * width, y * height)

这是一个概念证明的例子。请注意,在进行此屏幕录像之前,我们只训练了很少的数据。这是我们的鼠标根据眼睛自动移动到终端应用程序窗口的视频。就像我说的那样,这很容易,因为数据很少。有了更多的数据,它有望稳定到足以以更高的特异性进行控制。仅用几百张图像,你们就只能将其移动到注视的整个区域内。另外,如果在整个数据收集过程中,你们在屏幕的特定区域(例如边缘)都没有拍摄任何图像,则该模型不太可能在该区域内进行预测。

感谢各位的阅读,以上就是“Opencv实现眼睛控制鼠标的案例分析”的内容了,经过本文的学习后,相信大家对Opencv实现眼睛控制鼠标的案例分析这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

--结束END--

本文标题: Opencv实现眼睛控制鼠标的案例分析

本文链接: https://lsjlt.com/news/322787.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Opencv实现眼睛控制鼠标的案例分析
    这篇文章主要讲解了“Opencv实现眼睛控制鼠标的案例分析”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Opencv实现眼睛控制鼠标的案例分析”吧!在开始项目之前,我们需要引入第三方库。#&...
    99+
    2023-06-29
  • Opencv实现眼睛控制鼠标的实践
    如何用眼睛来控制鼠标?一种基于单一前向视角的机器学习眼睛姿态估计方法。在此项目中,每次单击鼠标时,我们都会编写代码来裁剪你们的眼睛图像。使用这些数据,我们可以反向训练模型,从你们您的...
    99+
    2024-04-02
  • Pygame实现监听鼠标的示例分析
    Pygame实现监听鼠标的示例分析,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。初始化参数import pygame, sysfrom pyg...
    99+
    2023-06-22
  • C++实现鼠标控制的黑框象棋
    本文实例为大家分享了C++实现鼠标控制的黑框象棋的具体代码,供大家参考,具体内容如下 该象棋小游戏的特色 有颜色标注出 红方和绿方 可以用鼠标控制 颜色原理 直接调用用Windows...
    99+
    2024-04-02
  • C#实现绘制鼠标的示例代码
    目录实践过程效果代码实践过程 效果 代码 public partial class Form1 : Form { public Form1() ...
    99+
    2022-12-23
    C#绘制鼠标 C# 鼠标
  • JavaScript实现鼠标控制自由移动的窗口
    本文实例为大家分享了JavaScript实现鼠标控制自由窗口的具体代码,供大家参考,具体内容如下 代码: <!DOCTYPE html> <html lang...
    99+
    2024-04-02
  • C++如何实现鼠标控制的黑框象棋
    这篇文章将为大家详细讲解有关C++如何实现鼠标控制的黑框象棋,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。本文实例为大家分享了C++实现鼠标控制的黑框象棋的具体代码,该象棋小游戏的特色有颜色标注出 红方和...
    99+
    2023-06-15
  • kubernetes中控制器和标签的示例分析
    小编给大家分享一下kubernetes中控制器和标签的示例分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!01 k8s中的常用控制器      之前我们了解了Pod是k8s集群中调度的最小单...
    99+
    2023-06-14
  • MySQL中流程控制和游标的示例分析
    小编给大家分享一下MySQL中流程控制和游标的示例分析,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!学习或者了解过编程语言的都知道,任何一门编程语言都不可能只通过一两句语句代码完成。流程控...
    99+
    2024-04-02
  • jQuery鼠标移动图片上实现放大效果的示例分析
    小编给大家分享一下jQuery鼠标移动图片上实现放大效果的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!首先界面上要有图...
    99+
    2024-04-02
  • Laravel8的路由与控制器实例分析
    本篇内容介绍了“Laravel8的路由与控制器实例分析”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!laravel访问路径是: 1 ) 路由...
    99+
    2023-06-30
  • SpringMVC bean加载控制的实现分析
    目录一、问题分析二、思路分析三、环境准备四、设置bean加载控制一、问题分析 入门案例的内容已经做完了,在入门案例中我们创建过一个SpringMvcConfig的配置类,再回想前面咱...
    99+
    2023-02-06
    SpringMVC bean加载控制 SpringMVC bean加载机制
  • MySQL事务隔离实现并发控制的示例分析
    这篇文章主要介绍了MySQL事务隔离实现并发控制的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。一、并发访问控制实现的并发访问的控制技术是基于锁;锁分为表级锁和行级锁...
    99+
    2023-06-20
  • js鼠标经过tab选项卡时实现切换延迟的示例分析
    这篇文章将为大家详细讲解有关js鼠标经过tab选项卡时实现切换延迟的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。    ...
    99+
    2024-04-02
  • 使用vue-router实现动态权限控制的示例分析
    这篇文章将为大家详细讲解有关使用vue-router实现动态权限控制的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。使用vue开发带权限管理系统,尤其是采用了vu...
    99+
    2024-04-02
  • css3 transform及原生js实现鼠标拖动3D立方体旋转的示例分析
    这篇文章将为大家详细讲解有关css3 transform及原生js实现鼠标拖动3D立方体旋转的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。js的作用是什么1、能够嵌入动态文本于HTML页面。2、...
    99+
    2023-06-08
  • Python selenium的基本元素与键盘鼠标模拟事件实例分析
    本篇内容主要讲解“Python selenium的基本元素与键盘鼠标模拟事件实例分析”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python selenium的基本元素与键盘鼠标模拟事件实例分...
    99+
    2023-07-02
  • 基于角色的权限控制模型RBAC实例分析
    本篇内容主要讲解“基于角色的权限控制模型RBAC实例分析”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“基于角色的权限控制模型RBAC实例分析”吧!一、RBAC权限模型简介RBAC权限模型(Rol...
    99+
    2023-06-29
  • 基于Apache组件分析对象池原理的实现案例分析
    目录一、设计与原理1、基础案例2、接口设计1.1 PooledObjectFactory 接口1.2 ObjectPool 接口1.3 PooledObject 接口3、运行原理二、...
    99+
    2024-04-02
  • Python中的变量、运算符与流程控制实例分析
    本篇内容主要讲解“Python中的变量、运算符与流程控制实例分析”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python中的变量、运算符与流程控制实例分析”吧!一、执行Python程序的两种方...
    99+
    2023-06-30
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作