返回顶部
首页 > 资讯 > 后端开发 > Python >Python调用百度AI实现图片上表格识别功能
  • 442
分享到

Python调用百度AI实现图片上表格识别功能

2024-04-02 19:04:59 442人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

目录简介步骤安装百度ai库注册百度AI开放平台调用AipOcr库识别表格文字可能遇到的问题批量操作总结简介 python免费调用百度AI实现图片上面的表格识别 步骤 安装百度AI库

简介

python免费调用百度AI实现图片上面的表格识别

步骤

安装百度AI库


!pip install baidu-aip

注册百度AI开放平台

先注册百度AI,获得ID和密钥。注册方法可参考:注册方法 只需走到 “1.6 获取密钥” 即可。然后记录下自己的APP_ID、api_KEY、SECRET_KEY,就可以开始了。

调用AipOcr库识别表格文字


from aip import AipOcr #导入AipOcr模块,用于做文字识别

APP_ID = '*********' # 你申请的
API_KEY = '*********'# 你申请的
SECRET_KEY = '*********'# 你申请的
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

选择的图片为某化学方程式表(来源于网络

以二进制方式打开图片,读取:


file = "表格图片\\化学方程式表.jpg"
pic = open(file,'rb') #以二进制方式打开图片
img = pic.read() #读取
table = client.tableRecognitionAsync(img)    #调用表格识别模块
print(table)

然后调用表格识别模块tableRecognitionAsync(),并将返回值存入变量table中并查看:

table是一个字典,其中有2个键,一个叫result,一个叫log_id。我们需要的是result中的request_id,可以通过如下语句获取:


request_id = table['result'][0]['request_id']
request_id

通过这个ID,可以获取识别完成后所保存的excel表格的下载地址。将request_id传入getTableRecognitionResult()就能获取结果。


result = client.getTableRecognitionResult(request_id)
print(result)

打印一下结果result,就能看到下面的内容。其中result_data对应的那个网址就是Excel表格的下载地址。

调用WEBbrowser库使用webbrowser.open(url)语句自动打开网址进行下载:


url = result['result']['result_data']

import webbrowser # 打开浏览器
webbrowser.open(url)

附:Python 通过浏览器 打开指定网址

1.通过默认浏览器打开网页


import webbrowser
webbrowser.open("Http://www.baidu.com")

 webbrowser.open(url, new=0, autoraise=True) 在系统的默认浏览器中访问url地址,如果new=0, url会在同一个

    浏览器窗口中打开;如果new=1,新的浏览器窗口会被打开;new=2 新的浏览器tab会被打开

2.通过os模块,启动浏览器并打开指定网页


import os
os.system('"C:\Program Files\internet explorer\iexplore.exe" http://www.baidu.com')

3.使用selenium


from selenium import webdriver
url='http://www.baidu.com'
driver = webdriver.Firefox()
driver.get(url)

识别结果如下:

这个Excel文件有6张工作表,具体包含与图片中表格内容的对应关系如下。body储存表格部分的内容,header储存表头的文字,footer储存表尾的文字。

识别效果并非完美,但是整体看来还行,当然,原稿越清晰,识别效果越好。

可能遇到的问题

在开始前,需要检查图片的大小,必须在1K~4M之间,不然会报错“‘error_msg': ‘image size error, image is too big or too small, upper limit 4M, lower limit 1k, please check your param'”。

批量操作

先获取所有图片的路径,存入pictures列表。结果如下。


#获取路径下所有图片文件,并存入列表
import os
work_path = "表格图片\\"
pictures=[] # 存储文件夹内所有文件的路径(包括子目录内的文件)
for root, dirs, files in os.walk(work_path):
    path = [os.path.join(root, name) for name in files]
    pictures.extend(path)
pictures

然后将所有图片逐个传入表格识别接口,获取其请求ID及存有识别结果的Excel文件的下载地址。在提取Excel下载路径之前,需要先判断识别是否完成。这是通过识别结果返回的字典中的'ret_msg'对应的值来判断的。只有当它是“已完成”时,才能获得下载链接。此处用了while循环,每隔2秒刷新一下状态,直到状态是“已完成”时,才提取链接。然后使用requests.get()获取下载链接信息,写入Excel文件。Excel自动命名及下载结果如图。


from aip import AipOcr  #导入AipOcr模块,用于做文字识别
import time #时间模块
import requests #用于HTTP请求

APP_ID = '24800359' # 你申请的
API_KEY = 'PrmTtmrqkeaqhvxOPEN4eZVt'# 你申请的
SECRET_KEY = 'LOFpCH6wpLV7xZPG0DTcvV4x1Sqyvmk9'# 你申请的
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

#提交识别请求,并储存所有请求ID
for picture in pictures:
    pic = open(picture,'rb') #以二进制方式打开图片
    img = pic.read() #读取
    table = client.tableRecognitionAsync(img)    #调用表格识别模块
    request_id = table['result'][0]['request_id']
    
    #判断识别是否完成,直到完成才根据请求ID获取Excel下载路径
    result = client.getTableRecognitionResult(request_id)  #通过ID获取识别结果
    while result['result']['ret_msg'] != '已完成': #如果状态是“已完成”,才能获取下载地址
        time.sleep(2) #暂停2秒再刷新
        result = client.getTableRecognitionResult(request_id) #持续刷新,直到满足条件
        
    download_path = result['result']['result_data']
    
    #下载并将Excel文件名设为图片名
    excel_name = picture.split(".")[0] + ".xls" #让excel文件的名字与图片相同
    excel = requests.get(download_path) #抓取下载链接
    file = open(excel_name, 'wb') #新建excel文件
    file.write(excel.content) #写入excel文件并保存

总结

到此这篇关于Python调用百度AI实现图片上表格识别功能的文章就介绍到这了,更多相关Python调用百度AI识别表格内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python调用百度AI实现图片上表格识别功能

本文链接: https://lsjlt.com/news/135651.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python调用百度AI实现图片上表格识别功能
    目录简介步骤安装百度AI库注册百度AI开放平台调用AipOcr库识别表格文字可能遇到的问题批量操作总结简介 Python免费调用百度AI实现图片上面的表格识别 步骤 安装百度AI库 ...
    99+
    2024-04-02
  • Python调用百度AI实现图片上文字识别功能实例
    目录简介步骤安装百度AI库注册百度AI开放平台调用glob库调用AipOcr库识别文字可能会遇到的问题批量操作总结简介 Python免费调用百度AI实现图片上面的文字识别 步骤 安装...
    99+
    2024-04-02
  • Python调用百度AI实现身份证识别
    目录一、安装baidu-aip模块二、获取百度AI接口密钥三、调用百度接口识别身份证一、安装baidu-aip模块 按win+R打开cmd,在里面输入 pip3 install ...
    99+
    2024-04-02
  • Python调用百度AI怎样实现身份证识别
    Python调用百度AI怎样实现身份证识别,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。一、安装baidu-aip模块按win+R打开cmd,在里面输入pip3...
    99+
    2023-06-25
  • Python实战之实现百度智能图片识别
    这是我们最终的效果,那么我们一起来看一看如何实现吧!超简单易上手哦! 首先我们需要先配置pyqt5的资源,这里就不说关于安装包的问题了(pip或者pycharm可以直接添加解决的问...
    99+
    2024-04-02
  • Python调用百度AI实现颜值评分功能
    目录一、调用百度接口进行人脸属性识别二、根据年龄和性别对颜值进行评价三、批量识别人脸属性四、自定义窗口语音播报颜值得分五、明星颜值评价一、调用百度接口进行人脸属性识别 安装好baid...
    99+
    2024-04-02
  • python调用百度AI提取图片文字
    python本身也有识别图片转文字的框架,但是相比调用接口,识别的精度就略显不行了; 这是 百度AI 的网站: https://ai.baidu.com/ ; 点击右上角的 控制台 ,申请或者登陆; 进去之后左侧有 【文字识别】:点击【创建...
    99+
    2023-01-31
    文字 图片 python
  • Python怎么调用百度AI实现颜值评分功能
    本篇内容主要讲解“Python怎么调用百度AI实现颜值评分功能”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python怎么调用百度AI实现颜值评分功能”吧!一、调用百度接口进行人脸属性识别安装...
    99+
    2023-06-21
  • Python调用百度api怎么实现语音识别
    Python调用百度api怎么实现语音识别,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。最近在学习python,做一些python练习题github上几年前的练习题有一题是这样...
    99+
    2023-06-21
  • Python调用百度api实现语音识别详解
    最近在学习python,做一些python练习题 github上几年前的练习题 有一题是这样的: 使用 Python 实现:对着电脑吼一声,自动打开浏览器中的默认网站。 例如,对着笔...
    99+
    2024-04-02
  • Java通过百度API实现图片车牌号识别
    本代码功能是通过调用百度API实现的,所有你需要去百度API官网申请下你的API Key 以及Secret Key才能使用它的功能哦! 拟采用百度AI实现该功能(http://ai....
    99+
    2024-04-02
  • Python调用百度AI实现人像分割详解
    目录一、原始视频截图二、提取人像三、和背景图合并四、合成视频一、原始视频截图 import cv2 cap=cv2.VideoCapture(r"【小仙若】shake it !冬...
    99+
    2024-04-02
  • Unity接入百度AI实现通用物体和场景识别
    接口介绍: 可识别超过10万类常见物体和场景,接口返回大类及细分类的名称,并支持获取识别结果对应的百科信息;还可使用EasyDL定制训练平台,定制识别分类标签。广泛适用于图像或视频内...
    99+
    2024-04-02
  • Python如何使用face_recognition实现AI识别图片中的人物
    这篇文章给大家分享的是有关Python如何使用face_recognition实现AI识别图片中的人物的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。环境安装首先我们看看官方给出的人脸识别效果图我们看一下READM...
    99+
    2023-06-26
  • java实现识别二维码图片功能
    本文实例为大家分享了java实现识别二维码图片功能,供大家参考,具体内容如下 所需maven依赖 <dependency>    <groupId>com.g...
    99+
    2024-04-02
  • Android中怎么实现图片识别功能
    本篇文章为大家展示了Android中怎么实现图片识别功能,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。1、界面我采用了一个SurfaceView用来显示摄像头的预览画面,重写了一个SurfaceVi...
    99+
    2023-05-30
    android
  • Unity接入百度AI如何实现通用物体和场景识别
    Unity接入百度AI如何实现通用物体和场景识别,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。接口介绍:可识别超过10万类常见物体和场景,接口返回大类及细分类的...
    99+
    2023-06-26
  • java怎么实现识别二维码图片功能
    本篇内容介绍了“java怎么实现识别二维码图片功能”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!所需maven依赖<dependenc...
    99+
    2023-06-30
  • 基于JAVA和百度智能AI的车牌识别系统的设计与实现
    【后台管理员功能】 系统设置:设置网站简介、关于我们、联系我们、加入我们、法律声明 广告管理:设置小程序首页轮播图广告和链接 留言列表:所有用户留言信息列表,支持删除 会员列表:查看所有注册会员信息,支持删除 资讯分类:录入、修改、查看、删...
    99+
    2023-08-31
    人工智能 小程序
  • 在Android中使用ksoap调用webservice实现图片上传功能
    本篇文章给大家分享的是有关在Android中使用ksoap调用webservice实现图片上传功能,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。代码实现private Exec...
    99+
    2023-05-31
    android ksoap webservice
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作