返回顶部
首页 > 资讯 > 后端开发 > Python >python EasyOCR库实例用法介绍
  • 191
分享到

python EasyOCR库实例用法介绍

pythonEasyOCR库 2022-06-02 22:06:37 191人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

说明 EasyOCR是一个用python编写的OCR三方库。可以在Python中调用,用来识别图像中的文字,并输出为文本。 支持80多种语言的识别,识别精度高,甚至要超过PaddleOCR。 安装命令 pip i

说明

EasyOCR是一个用python编写的OCR三方库。可以在Python中调用,用来识别图像中的文字,并输出为文本。

支持80多种语言的识别,识别精度高,甚至要超过PaddleOCR。

安装命令


pip install easyocr

代码实现


import easyocr
 
#设置识别中英文两种语言
reader = easyocr.Reader(['ch_sim','en'], gpu = False) # need to run only once to load model into memory
result = reader.readtext(r"d:\Desktop\4A34A16F-6B12-4ffc-88C6-FC86E4DF6912.png", detail = 0)
print(result)

实例扩展:

图文提取的代码


from pathlib import Path
import easyocr


file_url = r'识别图片.jpg'    # 需识别的图片
split_symbol = ' '          # 默认空格为分隔符
row_space = 15              # 默认字符高度为15px,当识别出来的字符间距超过这个数值时会换行。


def make_reader():
    # 将模型加载到内存中。模型文件地址 C:\Users\用户\.EasyOCR\model
    reader = easyocr.Reader(['ch_sim', 'en'])
    return reader


def change_to_character(file_url, reader, split_symbol=' ', row_space=15, save_dir='.'):
    with open(file_url, "rb") as img:
        img_b = img.read()
    result = reader.readtext(img_b)

    result.sort(key=lambda x: x[0][0][1])  # 按竖直方向,进行排序==>进行分行处理。
    # for i in result:
    #     print(i)
    # print('='*100)

    # 按行进行分组
    content = []
    item = [result[0]]  # 首先放入第一个元素
    for i in result[1:]:
        if row_space >= i[0][0][1] - item[-1][0][0][1] >= 0:
            item.append(i)
        else:
            content.append(item)
            item = [i]
    content.append(item)

    filemane = Path(file_url).name.split('.')[0]
    with open(f'{save_dir}/{filemane}.txt', "w", encoding='utf8') as t:
        for i in content:                     # i 为每一行的内容
            i.sort(key=lambda x: x[0][0][0])  # 对每行的内容进行先后排序
            for r in i:
                # print(r)
                t.write(r[1] + split_symbol)
            t.write("\n")
    return content


if __name__ == "__main__":
    change_to_character(file_url,  make_reader())

UI 界面的代码


import tkinter as tk
from tkinter import filedialog
from PIL import Image, ImageTk
from pathlib import Path
from character import change_to_character, make_reader
from threading import Thread
import time

# class Showing(tk.Frame):
#     def __init__(self, master=None):
#         super().__init__(master)
#         self.master = master
#         self.pack()
#         # self.img = tk.PhotoImage(file=r"C:\Users\yanhy\Desktop\捕获22.PNG")
#         self.create_widgets()
#
#     def create_widgets(self):
#         self.img = tk.PhotoImage(file=r"C:\Users\yanhy\Desktop\捕获22.PNG")
#         self.img_wig = tk.Label(self, image=self.img)
#         self.img_wig.pack()


# 最外层窗口设置
root = tk.Tk()
root.title('图片文字识别程序                    联系:410889472@qq.com')
window_x = root.winfo_screenwidth()
window_y = root.winfo_screenheight()
WIDTH = 1200
HEIGHT = 750
x = (window_x - WIDTH) / 2  # 水平居中
y = (window_y - HEIGHT) / 3  # 垂直偏上
root.geometry(f'{WIDTH}x{HEIGHT}+{int(x)}+{int(y)}')
root.resizable(width=False, height=False)

# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》
Row_space = 15
File_url_list = []
Img_type = ['.jpg', '.jpeg', '.png', '.gif']
Split_symbol = ' '                               # 间隔符。
Save_dir = Path.cwd().joinpath('img_to_Word')
if Save_dir.is_dir():
    pass
else:
    Path.mkdir(Save_dir)

# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》

def test():
    print(f'{Row_space=}')


def choose_file():       # 获取导入的图片路径地址
    global show_img, img_label, text, File_url_list
    filenames = filedialog.askopenfilenames()
    if len(filenames) == 1 and len(File_url_list) == 0:       # 单张图片导入,显示图片
        if Path(filenames[0]).suffix.lower() in Img_type:     # 判断是否图片类型
            File_url_list = list(filenames)
            try:
                if text.winfo_exists():
                    text.destroy()
            except NameError as e:
                print(f'choose_file提示:张图片导入错误>>> {e}')
            try:
                if img_label.winfo_exists():
                    img_label.destroy()
            except NameError as e:
                print(f'choose_file提示:单张图片导入错误>>> {e}')
            img = Image.open(File_url_list[0]).resize((560, 660))
            # print(img.size)
            show_img = ImageTk.PhotoImage(image=img)
            img_label = tk.Label(f_left, image=show_img)
            img_label.pack()
        else:
            print('导入的是非图像格式')
    else:                                     # 多张图片导入,显示列表。
        try:
            if img_label.winfo_exists():
                img_label.destroy()
        except NameError as e:
            print(f'提示:多张图片导入错误>>> {e}')
        try:
            if text.winfo_exists():
                text.destroy()
        except NameError as e:
            print(f'提示:多张图片导入错误>>> {e}')
        text = tk.Text(f_left, spacing1=5, spacing3=5)
        text.pack(fill='both', expand=True)


        for i in filenames:
            if Path(i).suffix.lower() in Img_type:
                File_url_list.append(i)
            else:
                pass
        File_url_list = set(File_url_list)
        for i in list(File_url_list):       # 把文件写入到文本框中
            text.insert('end', str(list(File_url_list).index(i)+1) + ": " + i + "\n")
        File_url_list = list(File_url_list)
    print(f'{File_url_list=}')


def choose_dir():
    global show_img, img_label, text, File_url_list
    directoryname = filedialog.askdirectory()
    print(f'{directoryname=}')
    try:
        if img_label.winfo_exists():
            img_label.destroy()
    except NameError as e:
        print(f'choose_dir提示:多张图片导入错误>>> {e}')
    try:
        if text.winfo_exists():
            text.destroy()
    except NameError as e:
        print(f'choose_dir提示:多张图片导入错误>>> {e}')
    text = tk.Text(f_left, spacing1=5, spacing3=5)
    text.pack(fill='both', expand=True)

    for i in Path(directoryname).iterdir():       # 获取文件夹下的所有文件。
        if Path(i).suffix.lower() in Img_type:
            File_url_list.append(i.as_posix())    # as_posix() 把Path型转为字符串。
        else:
            pass
    File_url_list = set(File_url_list)
    for i in list(File_url_list):  # 把文件写入到文本框中
        text.insert('end', str(list(File_url_list).index(i) + 1) + ": " + i + "\n")
    File_url_list = list(File_url_list)
    print(f'{File_url_list=}')


def clear_file_list():
    global File_url_list
    File_url_list.clear()
    try:
        if img_label.winfo_exists():
            img_label.destroy()
    except NameError as e:
        print(f'clear_file_list提示:清空错误>>> {e}')
    try:
        if text.winfo_exists():
            text.destroy()
    except NameError as e:
        print(f'clear_file_list提示:清空错误错误>>> {e}')


def get_entry1():       # 设置换行间距变量值
    global Row_space
    num = entry1.get()
    if num.isdigit():
        if int(num) > 0:
            Row_space = int(num)
    else:
        entry1.delete(0, "end")
        entry1.insert(0, 15)
        Row_space = 15


def set_split_symbol():
    global Split_symbol
    Split_symbol = entry2.get()
    print(f'{Split_symbol=}')


def do_change():
    if File_url_list:
        v.set("文字提取中,请稍后……")
        button_do.config(state='disable')        # 使按钮不可用。
        # ========================================
        def main():
            reader = make_reader()
            for i in File_url_list:
                content = change_to_character(i, reader, row_space=Row_space, split_symbol=Split_symbol, save_dir=Save_dir)
                read_text.delete(1.0, "end")
                for c in content:  # i 为每一行的内容
                    c.sort(key=lambda x: x[0][0][0])  # 对每行的内容进行先后排序
                    for r in c:
                        # print(r)
                        read_text.insert('end', r[1] + Split_symbol)
                    read_text.insert('end', "\n")
            v.set("文字提取结束。")
            button_do.config(state='nORMal')     # 恢复按钮可用。
        # ========================================
        t = Thread(target=main, daemon=True)
        t.start()

    else:
        v.set("请先选择图片!")


def join_file():
    v.set("文件开始合并。")
    filst = list(Path(Save_dir).iterdir())      # 获取文件夹中所有的文本文件。
    with open(f'{Save_dir}/合并文件.txt', 'w', encoding='utf8') as join_f:
        for f in filst:
            with open(f, 'r', encoding='utf8') as r_f:
                read_con = r_f.read()
            join_f.write(f.name+'\n'+read_con + '\n\n')
    time.sleep(1)
    v.set("文件合并完毕。")


# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》
f_top = tk.Frame(root, height=65, width=1100, bd=1, relief="flat")  # "sunken" "raised","groove" 或 "ridge"
f_top.pack_propagate(False)  # 如果不加这个参数,当Frame框架中加入部件时,会自动变成底层窗口,自身的特性会消失。
f_top.pack(side='top', pady=5)

f_left = tk.Frame(root, height=660, width=560, bd=1, relief="groove")
f_left.pack_propagate(False)
f_left.pack(side='left', padx=20)

f_right = tk.Frame(root, height=660, width=560, bd=1, relief="groove")
f_right.pack_propagate(False)
f_right.pack(side='left', padx=20)

read_text = tk.Text(f_right, spacing1=5, spacing3=5)
read_text.pack(fill='both', expand=True)


# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》
button_choose_file = tk.Button(f_top, text='选择图片', command=choose_file)
button_choose_file.pack(side='left', padx=10, ipadx=5)

button_choose_file = tk.Button(f_top, text='选择文件夹', command=choose_dir)
button_choose_file.pack(side='left', padx=10, ipadx=5)

button_clear_file = tk.Button(f_top, text='清空选择', bg='#FFEF2F', command=clear_file_list)
button_clear_file.pack(side='left', padx=5, ipadx=5)

# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》
f_row_content = tk.Frame(f_top, height=50, width=300, bg="#D1D4D0", relief="flat")  # "sunken" "raised","groove" 或 "ridge"
f_row_content.pack_propagate(False)
f_row_content.pack(side='left', padx=15)

button_set_row_height = tk.Button(f_row_content, text='设置行间距', command=get_entry1)
button_set_row_height.pack(side='left', ipadx=3, padx=3)

entry1 = tk.Entry(f_row_content, font=('', 18), width=3)
entry1.insert(0, 15)
entry1.pack(padx=5, side='left')

tk.Label(f_row_content, justify='left', text='填入像素值,设置换行间距。\n默认15个像素。').pack(side='left')

# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》
f_split = tk.Frame(f_top, height=50, width=215, bg="#D1D4D0", relief="flat")  # "sunken" "raised","groove" 或 "ridge"
f_split.pack_propagate(False)
f_split.pack(side='left', padx=4)

button_split = tk.Button(f_split, text='设置分隔符', command=set_split_symbol)
button_split.pack(side='left', ipadx=3, padx=3)

entry2 = tk.Entry(f_split, font=('', 18), width=3)
entry2.insert(0, ' ')
entry2.pack(padx=5, side='left')

tk.Label(f_split, justify='left', text='默认一个空格').pack(side='left')

# 《《《《《《《《《《《《《《《《《《《《《《  提取 合并文件  》》》》》》》》》》》》》》》》》》》》》》》》》
button_do = tk.Button(f_top, text='开始提取', bg='#4AB0FF', command=do_change)
button_do.pack(side='left', padx=10, ipadx=2)

button_join = tk.Button(f_top, text='合并文件', command=join_file)
button_join.pack(side='left', padx=5, ipadx=2)

v = tk.StringVar()
v.set('info……')
tk.Label(f_top, bg='#2EBD1D', justify='left', textvariable=v).pack(side='left')

# 《《《《《《《《《《《《《《《《《《《《《《  右键菜单  》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》
def copy_text():
    read_text.event_generate("<<Copy>>")

menubar = tk.Menu(tearoff=False)
# root['menu'] = menubar      # 没有把这个 菜单部件 加入到 root 窗口的菜单属性中,所以它不会在root窗口的顶部显示。
menubar.add_command(label='复制', command=copy_text)

def show_menu(event):
    """用 菜单部件 的 post 方法展示菜单"""
    menubar.post(event.x_root, event.y_root)

read_text.bind('<Button-3>', show_menu)
# 》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》》

root.mainloop()

到此这篇关于python EasyOCR库实例用法介绍的文章就介绍到这了,更多相关python EasyOCR库是什么内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: python EasyOCR库实例用法介绍

本文链接: https://lsjlt.com/news/11124.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • python EasyOCR库实例用法介绍
    说明 EasyOCR是一个用python编写的OCR三方库。可以在python中调用,用来识别图像中的文字,并输出为文本。 支持80多种语言的识别,识别精度高,甚至要超过PaddleOCR。 安装命令 pip i...
    99+
    2022-06-02
    python EasyOCR库
  • python EasyOCR库的用法
    这篇文章主要讲解了“python EasyOCR库的用法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“python EasyOCR库的用法”吧!说明EasyOCR是一个用python编写的O...
    99+
    2023-06-20
  • Javainterrupt()方法使用实例介绍
    目录前言栗子一栗子二大栗子前言 进入正题之前还是先回顾一个会被问无数遍的问题: stop和interrupt的区别是什么? 简单的说就是,stop的话,那线程就真的结束了。 inte...
    99+
    2023-02-03
    Java interrupt() Java interrupt()方法使用
  • python用pyecharts画地图实例介绍
    版本pyecharts 分为 v0.5.X 和 v1 两个大版本,v0.5.X 和 v1 间不兼容,v1 是一个全新的版本 v0.5.X支持 Python2.7,3.4+v1仅支持 ...
    99+
    2024-04-02
  • SpringBoot中activeMq的用法实例介绍
    本篇内容主要讲解“SpringBoot中activeMq的用法实例介绍”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“SpringBoot中activeMq的用法实例介绍”吧!SpringBoot...
    99+
    2023-06-20
  • python numpy库介绍
    目录1.NumPy( Numeric Python)2.numpy的引用3.Ndarray引入n维数组的意义ndarray的组成ndarray对象的属性3.数据类型ndarray数组...
    99+
    2024-04-02
  • Python中singledispatch库的具体用法介绍
    本篇内容主要讲解“Python中singledispatch库的具体用法介绍”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python中singledispatch库的具体用法介绍”吧!sing...
    99+
    2023-06-16
  • 用python实现词云效果实例介绍
    目录什么是词云一、特效预览二、程序原理三、程序源码总结什么是词云 词云其实就是就是对网络文本中出现频率较高的〝关键词〞予以视觉上的突出,形成〝关键词云层〞或〝关键词渲染〞从而过滤掉大...
    99+
    2024-04-02
  • SQL Server数据库DATEADD的语法介绍及使用实例
    DATEADD函数是SQL Server数据库中的一个内置函数,用于在指定日期上添加或减去指定的时间间隔。语法:DATEADD(da...
    99+
    2023-09-23
    SQL Server数据库
  • Spring Cloud OpenFeign实例介绍使用方法
    目录一. OpenFeign概述二. 使用步骤2.1 feign接口模块2.1.1依赖配置2.1.2编写FeignClient的接口, 并加@FeignCleint 注解2.2 消费...
    99+
    2024-04-02
  • Python中安装库的常用方法介绍
    目录方法一:需要在网络条件下安装方法二:离线安装方法三:换源安装总结方法一:需要在网络条件下安装 win+R进入运行框输入命令cmd 点击确定进入 普通下载:pip instal...
    99+
    2024-04-02
  • Java操作mysql数据库实例介绍
    这篇文章主要介绍“Java操作mysql数据库实例介绍”,在日常操作中,相信很多人在Java操作mysql数据库实例介绍问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Java...
    99+
    2024-04-02
  • Python中判断和循环语句的实例用法介绍
    这篇文章主要讲解了“Python中判断和循环语句的实例用法介绍”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python中判断和循环语句的实例用法介绍”吧!if、elif、elseage=1...
    99+
    2023-06-02
  • python函数式编程实例介绍
    这篇文章主要讲解了“python函数式编程实例介绍”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“python函数式编程实例介绍”吧!  函数式编程:是指代码中每一块都是不可变的,都由纯函数的...
    99+
    2023-06-02
  • Python全栈介绍MySQL数据库的示例
    这篇文章给大家分享的是有关Python全栈介绍MySQL数据库的示例的内容。小编觉得挺实用的,因此分享给大家做个参考。一起跟随小编过来看看吧。主要三个方面:1.Linux终端命令2.MySQL语句3.Pyt...
    99+
    2024-04-02
  • FormData的主要用处及实例用法介绍
    本篇内容主要讲解“FormData的主要用处及实例用法介绍”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“FormData的主要用处及实例用法介绍”吧!我们打印这个构造函数看一眼ƒ Fo...
    99+
    2023-06-03
  • php加密算法的实例介绍
    本篇内容主要讲解“php加密算法的实例介绍”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“php加密算法的实例介绍”吧!<php#加密算法header(&#...
    99+
    2024-04-02
  • C#接口方法的实例介绍
    本篇内容介绍了“C#接口方法的实例介绍”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!公有方法实现C#接口方法尽管C#在定义接口时不用指明接口...
    99+
    2023-06-18
  • MySQL数据库多实例介绍及安装
    MySQL数据库多实例介绍及安装1.mysql多实例实质在一台机器上开启多个不同的mysql服务端口(3306,3307),运行多个mysql服务进程,这些服务进程通过不同的socket监听不同的服务端口来提供各自的服务; 多个实例共用一套...
    99+
    2017-04-12
    MySQL数据库多实例介绍及安装 数据库入门 数据库基础教程 数据库 mysql
  • Python torch.onnx.export用法详细介绍
    目录函数原型参数介绍mode (torch.nn.Module, torch.jit.ScriptModule or torch.jit.ScriptFunction)args (t...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作