Python 官方文档:入门教程 => 点击学习
文章目录 前言一、PyPDF2库是什么?二、安装PyPDF2库三、查看PyPDF2库版本四、使用方法1.引入库2.定义pdf路径3.打开PDF文件4.创建PDF阅读器对象5.获取PDF文件中的
PyPDF2是一个用于处理PDF文件的python库,它提供了许多用于读取和操作PDF文件的功能。它可以对PDF文件进行合并、分割、旋转、提取页面、加密和解密等操作,也可以添加文本、图像和水印等元素到PDF文件中。
PyPDF2库允许开发人员通过Python代码轻松地处理PDF文件,因为它提供了一些简单易用的接口,同时它也非常灵活,可以根据需要进行自定义操作。对于需要处理PDF文件的Python应用程序,PyPDF2是一个非常实用的工具库。
pip install PyPDF2
pip show PyPDF2
Name: PyPDF2
Version: 3.0.1
Summary: A pure-python PDF library capable of splitting, merging, cropping, and transfORMing PDF files
Home-page:
Author:
Author-email: Mathieu Fenniak biziqe@mathieu.fenniak.net
License:
Requires: typing_extensions
Required-by:
import PyPDF2
local = '/Users/kkstar/Downloads/'
with open(local+'demo.pdf', 'rb') as pdf_file:
pdf_reader = PyPDF2.PdfReader(pdf_file)
num_pages = len(pdf_reader.pages)
for page_num in range(num_pages):
page = pdf_reader.pages[page_num]
page_text = page.extract_text()
print(page_text)
大家好,我是空空star,这是第一页。
大家好,我是空空star,这是第二页。
大家好,我是空空star,这是第三页。
Process finished with exit code 0
需要提取的pdf截图
来源地址:https://blog.csdn.net/weixin_38093452/article/details/130796365
--结束END--
本文标题: 通过Python的PyPDF2库提取pdf中的文字
本文链接: https://lsjlt.com/news/402003.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
2024-03-01
2024-03-01
2024-03-01
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0