首页 > 资讯 > 后端开发 > Python >OpenCV使用KNN完成OCR手写体识别

202

分享到

OpenCV使用KNN完成OCR手写体识别

OpenCV KNN识别OCR手写体 KNN识别OCR 2023-05-19 08:05:03 202人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

目录目标手写数字的OCR也可以用来预测单个数字英文字母的OCR目标在本章中，将学习使用kNN来构建基本的OCR应用程使用OpenCV自带的数字和字母数据集手写数字的OCR 目标

目标

在本章中，将学习

使用kNN来构建基本的OCR应用程
使用OpenCV自带的数字和字母数据集

手写数字的OCR

目标是构建一个可以读取手写数字的应用程序。为此，需要一些 train_data 和test_data 。OpenCV git项目中有一个图片 digits.png （opencv/samples/data/ 中），其中包含 5000 个手写数字（每个数字500个），每个数字都是尺寸大小为 20x20 的图像。

因此，第一步是将上面这张图像分割成 5000 （500*10）个不同的数字。对于每个数字，将其展平为 400 像素的一行，这就是训练集，即所有像素的强度值。这个是可以创建的最简单的特征集合。将每个数字的前 250个样本用作训练集train_data ，然后将 250 个样本用作测试集test_data 。

import cv2
import numpy as np
img = cv2.imread('digits.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# Now we split the image to 5000 cells, each 20x20 size
cells = [np.hsplit(row, 100) for row in np.vsplit(gray, 50)]
# Make it into a numpy array: its size will be (50, 100, 20, 20)
x = np.array(cells)
# Now we prepare the training data and test data
train = x[:,:50].reshape(-1,400).astype(np.float32) # Size = (2500,400)
test = x[:,50:100].reshape(-1,400).astype(np.float32) # Size = (2500,400)
# Create labels for train and test data
k = np.arange(10)
train_labels = np.repeat(k, 250)[:, np.newaxis]
test_labels = train_labels.copy()
# Initiate kNN, train it on the training data, then test it with the test data with k=1
knn = cv2.ml.KNearest_create()
knn.train(train, cv2.ml.ROW_SAMPLE, train_labels)
ret, result, neighbours, dist = knn.findNearest(test, k=5)
# Now we check the accuracy of classification
# For that, compare the result with test_labels and check which are wrong
matches = result==test_labels
correct = np.count_nonzero(matches)
accuracy = correct * 100.0/result.size
print( accuracy )  # 91.76

可以看到，上述构建了一个基础的数字手写体OCR应用程序已准备就绪。在这个特定的例子中的准确度是91.76％。

提高准确度方法：

一种提高准确性的选择是添加更多数据进行训练，尤其是错误的数据。
另外一种是更换更优的算法

本文中，每次启动应用程序时都找不到该训练数据，不如将其保存，以便下次直接从文件中读取此数据并开始分类。可以借助一些Numpy函数（例如np.savetxt，np.savez，np.load等）来完成此操作。

# Save the data
np.savez('knn_dight_data.npz', train=train, train_labels=train_labels)
# Now load the data
whit np.load('knn_data.npz') as data:
    print(data.files)
    train = data['train']
    train_labels = data['train_labels']

在windows系统下，大约需要大约 3.82 MB 的内存。由于仅使用强度值（uint8数据）作为特征，如果需要考虑内存的问题时候，可以先将数据转换为 np.uint8 ，然后再将其保存。在这种情况下，仅占用 0.98MB 。然后在加载时，可以转换回 float32 。

train_uint8 = train.astype(np.uint8)
train_labels_uint8 = train_labels.astype(np.uint8)
np.savez('knn_dight_data_int8.npz', train=train_uint8, train_labels=train_labels_uint8)

也可以用来预测单个数字

# 取测试集中的一个元素
single_data = testData[0].reshape(-1, 400)
single_label = labels[0]
ret, result, neighbours, dist = knn.findNearest(data, k=5)
print(result)  # [[0]]
print(label)   # [[0.]]
print(result==label)  # True

英文字母的OCR

接下来，对英语字母执行相同的操作，但是数据和特征集会稍有变化。OpenCV使用文件letter-recognition.data（ /data/samples/data/letter-recognition.data）代替图像。如果打开它，将看到20000行，乍一看可能看起来像垃圾数字。

实际上，在每一行中，第一列是字母，这是标签。接下来的16个数字是它的不同特征，这些特征是从UCI机器学习存储库获得的。可以在此页面中找到这些功能的详细信息。

现有20000个样本，将前10000个数据作为训练样本，剩余的10000个作为测试样本。字母应该更改为ASCII字符，因为不能直接使用字母。

import numpy as np
import cv2
#  Load the data and convert the letters to numbers
data = np.loadtxt('letter-recognition.data', dtype='float32', delimiter=',', converters={0: lambda ch: ord(ch)-ord('A')})
# Split the dataset in two, with 10000 samples each for training and test sets
train, test = np.vsplit(data, 2)
# Split trainData and testData into features and responses
responses, trainData = np.hsplit(train, [1])
labels, testData = np.hsplit(test, [1])
# Initiate the kNN, classify, measure accuracy
knn = cv2.ml.KNearest_create()
knn.train(trainData, cv2.ml.ROW_SAMPLE, responses)
ret, result, neighbours, dist = knn.findNearest(testData, k=5)
correct = np.count_nonzero(result==labels)
accuracy = correct * 100 / result.size
print(accuracy)  # 93.06

它给我的准确性为 93.06% 。同样，如果要提高准确性，则可以迭代地在每个类别中添加错误数据。

附加资源

docs.opencv.org/4.5.5/d8/d4…
arcHive.ics.uci.edu/ml/datasets…
en.wikipedia.org/wiki/Optica…

以上就是OpenCV使用KNN完成OCR手写体识别的详细内容，更多关于OpenCV KNN识别OCR手写体的资料请关注编程网其它相关文章！

您可能感兴趣的文档:

--结束END--

本文标题: OpenCV使用KNN完成OCR手写体识别

本文链接: https://lsjlt.com/news/212654.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

OpenCV使用KNN完成OCR手写体识别

目录

目标

手写数字的OCR

也可以用来预测单个数字

英文字母的OCR

OpenCV使用KNN完成OCR手写体识别

Python-OpenCV实战：利用KNN算法识别手写数字

Python-OpenCV中如何利用 KNN 算法识别手写数字

Python怎么使用opencv进行手势识别

Java使用opencv识别二维码的完整步骤

Python如何使用opencv进行手势识别详解

vue使用canvas手写输入识别中文

使用python svm实现直接可用的手写数字识别

PythonOpencv使用ann神经网络识别手写数字功能

详解Python手写数字识别模型的构建与使用

C++使用opencv调用级联分类器来识别目标物体的详细流程

手把手教你完成一个Python与OpenCV人脸识别项目（对图片、视频、摄像头人脸的检测）超详细保姆级记录！

使用CyberController来将旧手机改造成电脑外挂------手机交互翻译、人脸解锁、语音识别....各个功能等你来探索

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义