返回顶部
首页 > 资讯 > 后端开发 > Python >Python一键实现PDF文档批量转Word
  • 660
分享到

Python一键实现PDF文档批量转Word

2024-04-02 19:04:59 660人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

目录实现效果环境准备代码实现无论是在工作还是学习当中,大家都会遇到这样一个问题,将“pdf当中的内容(文本和图片)转换为Word的格式”,也就是说从只读转换成

无论是在工作还是学习当中,大家都会遇到这样一个问题,将“pdf当中的内容(文本和图片)转换为Word的格式”,也就是说从只读转换成可编辑的格式。网上绝大多数的工具也都是收费的,今天小编就给大家制作了一款批量将PDF文件转换为Word的神器,使用起来也是相当的方便。

实现效果

我们首先来看一下出来的效果,如下图所示

环境准备

用到的模块叫做pdf2docx,我们通过pip命令进行下载,如下

pip install pdf2docx

后续我们还可以为py文件打包,用到的库是pyinstaller

pip install pyinstaller

代码实现

我们先简单地实现将单个PDF文档转换成Word文档,代码如下

from pdf2docx import Converter
cv = Converter(r"pdf文件的路径")
cv.convert("test.docx", start=0,end=None)
cv.close()

那么上面的是单个PDF文件,要是涉及到是多个PDF文件,则需要用到遍历上传过来的每一个文件,用到for循环遍历

def startAction(self):
    output_path_1 = Path.joinpath(Path.home(), "Desktop")
    output_path_2 = str(output_path_1) + "\\output"
    if not os.path.exists(output_path_2):
        os.mkdir(output_path_2)

    for path_list in pdfPath_list:
        print("路径: ", path_list)
        name = path_list.split("/")[-1].split(".")[0]
        cv = Converter(path_list)
        cv.convert(output_path_2 + "\\{}.docx".fORMat(name), start=0, end=None)
        cv.close()

    msg_box = QMessageBox(QMessageBox.Information, '完成', '提取完成', QMessageBox.Yes)
    msg_box.exec_()

上述的代码,我们首先将指定好输出的Word文档的位置,这里小编设置的是在桌面,然后通过for循环去遍历处理每一个PDF文档,当所有的步骤都完成的时候,提示我们已经完成了。

当然整个可视化界面当中还有一个上传文件的功能,代码如下

# 选择本地文件上传
def uploadFiles(self):
    global pdfPath_list  # 这里为了方便别的地方引用文件路径,将其设置为全局变量
    pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上传文件", r"路径", "*.pdf;;All Files(*)")
    # 显示所选文件的路径
    self.ui.lineEdit.setText(",".join(pdfPath_list))

整体的代码如下所示

from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog
from PySide2.QtUiTools import QUiLoader
from pdf2docx import Converter
from pathlib import Path
import os

class OCRQt:
    def __init__(self):
        self.ui = QUiLoader().load('pdf2word.ui')
        self.ui.pushButton.clicked.connect(self.uploadFiles)
        self.ui.pushButton_2.clicked.connect(self.startAction)

    def uploadFiles(self):
        ........
        ........

    def startAction(self):
        .......
        .......

if __name__ == '__main__':
    app = QApplication([])
    # 显示创建的界面
    MainWindow = OCRQt()  # 创建窗体对象
    MainWindow.ui.show()  # 显示窗体
    app.exit(app.exec_())  # 程序关闭时退出进程

到此这篇关于python一键实现PDF文档批量转Word的文章就介绍到这了,更多相关Python PDF转Word内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python一键实现PDF文档批量转Word

本文链接: https://lsjlt.com/news/120186.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python一键实现PDF文档批量转Word
    目录实现效果环境准备代码实现无论是在工作还是学习当中,大家都会遇到这样一个问题,将“PDF当中的内容(文本和图片)转换为Word的格式”,也就是说从只读转换成...
    99+
    2024-04-02
  • Python批量实现Word、EXCLE、PPT转PDF文件
     一、绪论背景         在日常办公和文档处理中,有时我们需要将多个Word文档、Excel表格或PPT演示文稿转换为PDF文件。将文档转换为PDF格式的好处是它可以保留文档的布局和格式,并且可以在不同平台上进行方便的查看和共享。 ...
    99+
    2023-09-25
    win32com 办公自动化 批量实现
  • 基于pdf2docx模块怎么用Python实现批量将PDF转Word文档
    这篇“基于pdf2docx模块怎么用Python实现批量将PDF转Word文档”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“...
    99+
    2023-07-06
  • SpringBoot如何实现word文档转pdf
    目录一.背景二.方案选择1.Spire.Doc for Java方案2.docx4j方案3.jodconverter+LibreOffice 方案4.其他三.实操1.docx4j2....
    99+
    2024-04-02
  • Python实现Word文档样式批量处理
    这里批量处理word文档的操作主要是通过python-docx非标准库实现的,通过定位到文档对象、再到段落、最后到一行文本从而完成针对文字对象的处理。 使用pip的方式安装pyth...
    99+
    2024-04-02
  • 基于pdf2docx模块Python实现批量将PDF转Word文档的完整代码教程
    PDF文件是一种常见的文档格式,但是在编辑和修改时不太方便,因为PDF本质上是一种静态的文档格式。 因此,有时候我们需要将PDF文件转换成Word格式,以便更好地编辑和修改文档。在本...
    99+
    2023-05-15
    pdf2docx模块 Python PDF Python PDF转Word
  • Python实现pdf转word
    一、实验目标 通过利用python中的pyinstaller库和PySimpleGUI库,实现将pdf转为word的实际功能。 二、实验准备 安装pdf2docx库 pip install pdf2docx 安装PySimpleGUI库 p...
    99+
    2023-08-31
    python 开发语言 numpy
  • Go语言中如何实现PDF转word文档
    Go语言PDF转word文档步骤如下:1、设置许可证信息;2、打开PDF文件;3、创建一个新的Word文档;4、遍历PDF的每一页,将每一页转换为图像,并将图像插入到Word文档中;5、保存Word文档。本教程操作系统:windows10系...
    99+
    2023-12-13
    PDF转word go语言 Golang
  • python 针对在子文件夹中的md文档实现批量md转word
    前言; 最近想要实现批量将mardown文档转化为word。网上有很多解决的方法,但是自己保存的md文档在不同的文件夹,而大部分只能实现同一文件夹内的转换,因此稍加改进,得出以下功能...
    99+
    2024-04-02
  • 如何利用python将pdf文档转为word?
    1.前言 有些时候,我们需要将pdf文档转换为word文档进行处理,但市面上的一些pdf软件往往需要付费才能使用。那么作为一名技术人员,如何才能实现pdf转word自由? 2.准备工作 提前安装好py...
    99+
    2023-09-05
    word python pdf
  • Java实现PDF转为Word文档的示例代码
    目录代码编译环境将 PDF 转换为固定布局的 Doc/Docx 文档完整代码将 PDF 转换为流动形态的 Doc/Docx 文档完整代码效果图众所周知,PDF文档除了具有较强稳定性和...
    99+
    2023-01-28
    Java实现PDF转Word Java PDF转Word Java PDF Word
  • python怎么实现批量md转word
    这篇文章主要介绍“python怎么实现批量md转word”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“python怎么实现批量md转word”文章能帮助大家解决问题。前言;最近想要实现批量将mard...
    99+
    2023-06-29
  • Python怎么实现Word转PDF
    这篇文章主要讲解了“Python怎么实现Word转PDF”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python怎么实现Word转PDF”吧!pdf 工具包 - pdfkitpdfkit ...
    99+
    2023-06-30
  • Word转PDF功能实现,文档转换工具通过PHP开发
    最近比较火的文档转换工具相信大家都听说过,但是怎么实现呢? 通过该接口可以将图片、word、excel、ppt等文档转换为pdf格式的文件 可以将Office(Word,Excel,PowerPoint)文件转换为PDF。 转换文件内容、格...
    99+
    2023-09-02
    php http 开发语言
  • 简易教程:Go语言实现PDF转换为word文档
    Go语言实现PDF转Word文档的简明教程 概述 PDF转Word文档是将PDF格式的文件转换成Word格式的文件,这在实际工作中经常会遇到。Go语言提供了丰富的库和工具,可以帮助我们轻松实现PDF转Word...
    99+
    2024-02-01
    go语言 简明教程 pdf转word
  • 使用Python将Word文档转换为PDF的方法
    摘要: 文介绍了如何使用Python编程语言将Word文档转换为PDF格式的方法。我们将使用python-docx和pywin32库来实现这个功能,这些库提供了与Microsoft Word应用程序的交互能力。 正文: 在现实生活和工作中,...
    99+
    2023-10-03
    python word2pdf python-docx pywin32
  • 如何利用Python代码批量将PDF文件转为Word格式
    本篇文章给大家分享的是有关如何利用Python代码批量将PDF文件转为Word格式,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。在日常工作或学习中,经常会遇到这样的无奈:“小任...
    99+
    2023-06-17
  • 基于Python实现网页文章转PDF文档
    我们有时候看到一篇好的文章,想去保存下来,传统方式一般是收藏书签、复制粘贴到文档或者直接复制链接保存,但这样一次两次还好,数量多了,比较麻烦不说,还可能不好找~ 这个时候,Pyth...
    99+
    2024-04-02
  • python批量处理PDF文档输出自定义关键词的出现次数
    目录函数模块介绍对文件进行批量重命名将PDF转化为txt删除txt中的换行符添加自定义词语分词与词频统计主函数本地文件结构全部代码结果预览函数模块介绍 具体的代码可见全部代码部分,这...
    99+
    2023-05-15
    python批量处理PDF文档 python输出自定义关键词次数 python批量处理
  • Python批量对word文档进行操作步骤
    目录导读应用细节介绍导读 前面几章我们以经介绍了怎么批量对excel和ppt操作今天我们说说对word文档的批量操作 应用 python-docx允许您创建新文档以及对现有文档进行更...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作