返回顶部
首页 > 资讯 > 后端开发 > Python >Python实现pdf转word
  • 592
分享到

Python实现pdf转word

python开发语言numpy 2023-08-31 22:08:10 592人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

一、实验目标 通过利用python中的pyinstaller库和PySimpleGUI库,实现将pdf转为Word的实际功能。 二、实验准备 安装pdf2docx库 pip install pdf2docx 安装PySimpleGUI库 p

一、实验目标

通过利用python中的pyinstaller库和PySimpleGUI库,实现将pdf转为Word的实际功能。

二、实验准备

安装pdf2docx库

pip install pdf2docx

安装PySimpleGUI库

pip install PySimpleGUI

三、实验代码

from pdf2docx import Converterimport PySimpleGUI as sgdef pdf2word(file_path):    file_name = file_path.split('.')[0]    doc_file = f'{file_name}.docx'    p2w = Converter(file_path)    p2w.convert(doc_file, start=0, end=None)    p2w.close()    return doc_filedef main():    # 选择主题    sg.theme('DarkAmber')    layout = [        [sg.Text('pdfToword', font=('微软雅黑', 12)),         sg.Text('', key='filename', size=(50, 1), font=('微软雅黑', 10))],        [sg.Output(size=(80, 10), font=('微软雅黑', 10))],        [sg.FilesBrowse('选择文件', key='file', target='filename'), sg.Button('开始转换'), sg.Button('退出')]]    # 创建窗口    window = sg.Window("张卧虎", layout, font=("微软雅黑", 15), default_element_size=(50, 1))    # 事件循环    while True:        # 窗口的读取,有两个返回值(1.事件;2.值)        event, values = window.read()        print(event, values)        if event == "开始转换":            if values['file'] and values['file'].split('.')[1] == 'pdf':                filename = pdf2word(values['file'])                print('文件个数 :1')                print('\n' + '转换成功!' + '\n')                print('文件保存位置:', filename)            elif values['file'] and values['file'].split(';')[0].split('.')[1] == 'pdf':                print('文件个数 :{}'.fORMat(len(values['file'].split(';'))))                for f in values['file'].split(';'):                    filename = pdf2word(f)                    print('\n' + '转换成功!' + '\n')                    print('文件保存位置:', filename)            else:                print('请选择pdf格式的文件哦!')        if event in (None, '退出'):            break    window.close()main()

四、部分代码解析

pdf转word代码主体部分

def pdf2word(file_path):    file_name = file_path.split('.')[0]    doc_file = f'{file_name}.docx'    p2w = Converter(file_path)    p2w.convert(doc_file, start=0, end=None)    p2w.close()    return doc_file

convert(doc_file,start,end)函数中

doc_file:转化完成后文件名

start:转化开始页面

end:转化结束页面

注意点:

①若不给start,end参数则默认转化全篇

②对于不连续的页面,也可写作convert(doc_file , pages = [2,4,6])

图形化界面部分

sg.theme('default1')layout = [[sg.Text('pdfToword', font=('微软雅黑', 12)),        sg.Text('', key='filename', size=(50, 1), font=('微软雅黑', 10))],        [sg.Output(size=(80, 10), font=('微软雅黑', 10))],        [sg.FilesBrowse('选择文件', key='file', target='filename'), sg.Button('开始转换'),sg.Button('退出')]]window = sg.Window("id", layout, font=("微软雅黑", 15), default_element_size=(50, 1))

theme表示主题,即图形化界面的主题颜色(sg.theme_list()可以查看所有可用主题)

实现多个文件转化

if event == "开始转换":    if values['file'] and values['file'].split('.')[1] == 'pdf':        filename = pdf2word(values['file'])        print('文件个数 :1')        print('\n' + '转换成功!' + '\n')        print('文件保存位置:', filename)    elif values['file'] and values['file'].split(';')[0].split('.')[1] == 'pdf':        print('文件个数 :{}'.format(len(values['file'].split(';'))))        for f in values['file'].split(';'):            filename = pdf2word(f)            print('\n' + '转换成功!' + '\n')            print('文件保存位置:', filename)    else:        print('请选择pdf格式的文件')

①第一个if处,通过“.”进行划分,判断是否为单个且pdf格式文件

②else if处,通过“;”划分,将所有文件的存储路径储存在一个数组中,利用循环来遍历数组,从而达到依次转化的目的

③else处,若传入非pdf文件则输出提示文字

五、结果

220220a570b445aea523fc3ea03f0c6f.png

 完结撒花!

 

来源地址:https://blog.csdn.net/Josepyth/article/details/126603643

--结束END--

本文标题: Python实现pdf转word

本文链接: https://lsjlt.com/news/387170.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python实现pdf转word
    一、实验目标 通过利用python中的pyinstaller库和PySimpleGUI库,实现将pdf转为word的实际功能。 二、实验准备 安装pdf2docx库 pip install pdf2docx 安装PySimpleGUI库 p...
    99+
    2023-08-31
    python 开发语言 numpy
  • Python怎么实现Word转PDF
    这篇文章主要讲解了“Python怎么实现Word转PDF”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python怎么实现Word转PDF”吧!pdf 工具包 - pdfkitpdfkit ...
    99+
    2023-06-30
  • Python实现PDF转Word的方法详解
    由于PDF的文件大多都是只读文件,有时候为了满足可以编辑的需要通常可以将PDF文件直接转换成Word文件进行操作。 看了网络上面的python转换PDF文件为Word的相关文章感觉都...
    99+
    2023-02-16
    Python PDF转Word Python PDF Word
  • PHP怎么实现Word转PDF
    本篇内容介绍了“PHP怎么实现Word转PDF”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!PHP处理Word转PDF代码示例:<&n...
    99+
    2023-06-17
  • Python一键实现PDF文档批量转Word
    目录实现效果环境准备代码实现无论是在工作还是学习当中,大家都会遇到这样一个问题,将“PDF当中的内容(文本和图片)转换为Word的格式”,也就是说从只读转换成...
    99+
    2024-04-02
  • Python批量实现Word、EXCLE、PPT转PDF文件
     一、绪论背景         在日常办公和文档处理中,有时我们需要将多个Word文档、Excel表格或PPT演示文稿转换为PDF文件。将文档转换为PDF格式的好处是它可以保留文档的布局和格式,并且可以在不同平台上进行方便的查看和共享。 ...
    99+
    2023-09-25
    win32com 办公自动化 批量实现
  • Python自动化办公之Word转PDF的实现
    目录pdf 工具包 - pdfkithtml 转 pdf网址 转 pdf字符串生成pdf结合 pydocx 将 word 转 html 再转 pdf该章节我们将要学习如何将 word...
    99+
    2024-04-02
  • Java怎么实现Word/Pdf/TXT转html
    本篇内容介绍了“Java怎么实现Word/Pdf/TXT转html”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有...
    99+
    2024-04-02
  • SpringBoot如何实现word文档转pdf
    目录一.背景二.方案选择1.Spire.Doc for Java方案2.docx4j方案3.jodconverter+LibreOffice 方案4.其他三.实操1.docx4j2....
    99+
    2024-04-02
  • Java如何实现无损Word转PDF
    这篇文章主要介绍“Java如何实现无损Word转PDF”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Java如何实现无损Word转PDF”文章能帮助大家解决问题。word转pdf实现思路代码实现主要...
    99+
    2023-07-02
  • 利用C#/VB.NET实现将PDF转为Word
    目录将 PDF 转换为固定布局的 Doc/Docx 文档完整代码将 PDF 转换为流动形态的 Doc/Docx 文档完整代码效果图众所周知,PDF 文档支持特长文件,集成度和安全可靠...
    99+
    2022-12-19
    C# PDF转Word C# PDF Word
  • 怎么用两行Python代码实现pdf转word功能
    本篇内容主要讲解“怎么用两行Python代码实现pdf转word功能”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用两行Python代码实现pdf转word功能”吧!一、安装依赖包pip&n...
    99+
    2023-07-05
  • python怎么将pdf转换成word
    您可以使用Python中的pytesseract库将PDF文件转换为文本,然后使用Python-docx库将文本转换为Word文档。...
    99+
    2023-09-22
    python
  • Java如何实现PDF转HTML/Word/Excel/PPT/PNG
    这篇文章主要介绍了Java如何实现PDF转HTML/Word/Excel/PPT/PNG的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Java如何实现PDF转HTML/Word/Excel/PPT/PNG文章都...
    99+
    2023-06-30
  • Java 将PDF转为Word
    众所周知,PDF文档除了具有较强稳定性和兼容性外, 还具有较强的安全性,在工作中可以有效避免别人无意中对文档内容进行修改。但与此同时,也妨碍了对文档的正常修改。这时我们可以将PDF转为Word文档进行修改或再编辑。使用软件将 PDF 文档转...
    99+
    2023-09-05
    pdf 格式转换 word java
  • Java实现无损Word转PDF的示例代码
    目录前言word转pdf实现思路项目远程仓库Maven项目pom文件依赖核心代码实现结果分析前言 本来想写word转pdf和pdf转word的代码呢,没想到word转pdf就写了很多...
    99+
    2024-04-02
  • Android实现excel/pdf/word/odt/图片相互转换
    目录实践过程pdf转excelexcel转pdfppt转pdfpdf转pptpdf转wordword转pdfexcel转图片pdf转图片odt转pdf实践过程 pdf转excel p...
    99+
    2023-05-15
    Android excel pdf word odt图片转换 Android excel pdf word odt 图片 Android excel Android pdf Android word
  • PHP实现word转pdf的两种方式(有用!)
    目录方法一、使用phpword和tcpdf方法二、使用unoconv将 word转pdf (Centos 8)总结方法一、使用phpword和tcpdf 1. 使用composer ...
    99+
    2024-04-02
  • 如何使用C#/VB.NET实现将PDF转为Word
    本篇内容介绍了“如何使用C#/VB.NET实现将PDF转为Word”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!固定布局模式转换速度快,有利...
    99+
    2023-07-04
  • Go语言中如何实现PDF转word文档
    Go语言PDF转word文档步骤如下:1、设置许可证信息;2、打开PDF文件;3、创建一个新的Word文档;4、遍历PDF的每一页,将每一页转换为图像,并将图像插入到Word文档中;5、保存Word文档。本教程操作系统:windows10系...
    99+
    2023-12-13
    PDF转word go语言 Golang
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作