返回顶部
首页 > 资讯 > 后端开发 > Python >如何利用python将pdf文档转为word?
  • 733
分享到

如何利用python将pdf文档转为word?

wordpythonpdf 2023-09-05 20:09:00 733人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

1.前言 有些时候,我们需要将pdf文档转换为Word文档进行处理,但市面上的一些pdf软件往往需要付费才能使用。那么作为一名技术人员,如何才能实现pdf转word自由? 2.准备工作 提前安装好py

1.前言

有些时候,我们需要将pdf文档转换为Word文档进行处理,但市面上的一些pdf软件往往需要付费才能使用。那么作为一名技术人员,如何才能实现pdf转word自由?

2.准备工作

提前安装好python的环境,并且安装对应的第三方包:

pip install pdf2docx

3.实现方法

3.1 convert方法

from pdf2docx import Converter#需要转的pdf文件pdf_file_path=r'test.pdf'#输出的word文档out_file_path=r'test.docx'#进行转换new_converter=Converter(pdf_file_path)new_converter.convert(out_file_path)new_converter.close()

3.2 parse方法

from pdf2docx import parse#需要转的pdf文件pdf_file_path=r'test.pdf'#输出的word文档out_file_path=r'test.docx'#对所有页面进行转换,并输出parse(pdf_file_path, out_file_path)

3.3 仅转换其中几页

from pdf2docx import Converter#需要转的pdf文件pdf_file_path=r'test.pdf'#输出的word文档out_file_path=r'test.docx'#进行转换new_converter=Converter(pdf_file_path)#从第四页转换到最后一页,转换后输出new_converter.convert(out_file_path,start=3)#从第一页转换到第六页,转换后输出new_converter.convert(out_file_path,end=6)#从第四页转换到第六页,转换后输出new_converter.convert(out_file_path,start=3,end=6)new_converter.close()

转换其中的某些页面

#对pdf文档中的第1页、第四页和第九页就行转换,然后输出new_converter.convert(out_file_path,pages=[0,3,8])

3.4 调用多进程

from pdf2docx import Converter#需要转的pdf文件pdf_file_path=r'test.pdf'#输出的word文档out_file_path=r'test.docx'#进行转换new_converter=Converter(pdf_file_path)#进行多进程转换new_converter.convert(out_file_path, multi_processing=True)#指定数量new_converter.convert(out_file_path, multi_processing=True, cpu_count=4)new_converter.close()

3.5 处理有密码的pdf

from pdf2docx import Converter#需要转的pdf文件pdf_file_path=r'test.pdf'#输出的word文档out_file_path=r'test.docx'#加密的pdf文档密码pwd='pdf_2_word'#进行转换new_converter=Converter(pdf_file_path)new_converter.convert(out_file_path,pwd)new_converter.close()

3.6 将pdf转为表格

注意,本方法只能将以表格形式生成的pdf文档进行转换,不能处理含有表格的图片形式pdf文档。

from pdf2docx import Converterimport pandas as pdpdf_file_path=r'test.pdf'out_file_path=r'test.xlsx'cv = Converter(pdf_file_path)tables = cv.extract_tables()cv.close()# for table in tables:#     print(table)df=pd.DataFrame(tables[1:],columns=tables[0])df.to_excel(out_file_path,encoding='utf-8-sig')print(df)

4.后记

以上就是pdf转为word的方法,可以根据个人的情况进行调整。希望能够帮助到你~

来源地址:https://blog.csdn.net/qq_41780234/article/details/130508726

--结束END--

本文标题: 如何利用python将pdf文档转为word?

本文链接: https://lsjlt.com/news/396105.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 如何利用python将pdf文档转为word?
    1.前言 有些时候,我们需要将pdf文档转换为word文档进行处理,但市面上的一些pdf软件往往需要付费才能使用。那么作为一名技术人员,如何才能实现pdf转word自由? 2.准备工作 提前安装好py...
    99+
    2023-09-05
    word python pdf
  • 如何利用Python将html转为pdf、word文件
    目录前言转 pdf安装 pdfkit 库安装 wkhtmltopdf 文件url 生成 pdf本地 html 文件生成 pdf转 word安装 pypandoc 库安装 pandoc...
    99+
    2022-12-19
    python将html转pdf python将html转word python pdf处理
  • Java 将Word文档转换为PDF
    前言本文将介绍如何使用免费Java Word组件Free Spire.Doc for Java在Java应用程序中将Word文档转换到PDF格式。Free Spire.Doc for Java在转换过程中能够识别中文字符并支持丰富的word...
    99+
    2023-06-02
  • win8自带的Skydrive转换PDF文档将pdf转为word文档
    知识点分析: 优点:不需要安装任何第三方转换软件,直接将pdf转为word文档,且十分稳定,不会像第三方工具转换后打开会产生一些不能识别的乱码 操作步骤: 1.打开 https://skydrive.liv...
    99+
    2022-06-04
    文档 自带 Skydrive
  • 如何在iPhone上将Word文档转换为PDF
    无论是银行对账单还是求职简历,在某些场景下,您都需要在线提交 PDF 格式的文件。大多数文档仍然以Word格式在iPhone上存储的大部分时间。但是iPhone上没有专用的默认应用程序可以直接将Word文档转换为pdf格式,安装任何不安全的...
    99+
    2023-07-12
  • 使用Python将Word文档转换为PDF的方法
    摘要: 文介绍了如何使用Python编程语言将Word文档转换为PDF格式的方法。我们将使用python-docx和pywin32库来实现这个功能,这些库提供了与Microsoft Word应用程序的交互能力。 正文: 在现实生活和工作中,...
    99+
    2023-10-03
    python word2pdf python-docx pywin32
  • pdf文件如何转换为word文档
    这篇文章主要介绍了pdf文件如何转换为word文档,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。材料:PDF文件,电脑工具:PDF转换器(迅...
    99+
    2024-04-02
  • php如何将word文档转成PDF文件
    本文小编为大家详细介绍“php如何将word文档转成PDF文件”,内容详细,步骤清晰,细节处理妥当,希望这篇“php如何将word文档转成PDF文件”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。第一步:安装和配置...
    99+
    2023-07-05
  • 如何利用Python代码批量将PDF文件转为Word格式
    本篇文章给大家分享的是有关如何利用Python代码批量将PDF文件转为Word格式,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。在日常工作或学习中,经常会遇到这样的无奈:“小任...
    99+
    2023-06-17
  • 如何将php文件转为word文档
    本篇内容介绍了“如何将php文件转为word文档”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!准备工作在开始转换之前,您需要确保已经安装了 ...
    99+
    2023-07-05
  • 利用C#/VB.NET实现将PDF转为Word
    目录将 PDF 转换为固定布局的 Doc/Docx 文档完整代码将 PDF 转换为流动形态的 Doc/Docx 文档完整代码效果图众所周知,PDF 文档支持特长文件,集成度和安全可靠...
    99+
    2022-12-19
    C# PDF转Word C# PDF Word
  • php怎么将word文档转成PDF文件
    在如今数字化的时代,文档转换成PDF(Portable Document Format)是十分常见的需求,因为PDF是一种跨平台、适用于多种设备和操作系统的文件格式,具有良好的兼容性和可靠的可读性。而php作为一种强大的服务器端编程语言,可...
    99+
    2023-05-14
    php
  • SpringBoot如何实现word文档转pdf
    目录一.背景二.方案选择1.Spire.Doc for Java方案2.docx4j方案3.jodconverter+LibreOffice 方案4.其他三.实操1.docx4j2....
    99+
    2024-04-02
  • 怎么将php文件转为word文档
    在日常的工作中,我们经常会遇到需要将 PHP 格式的文档转换成 Word 文档的需求。尽管这个需求在很多人看来不是很常见,但它实际上是非常实用的,尤其是对于那些需要频繁处理大量文档的人来说。在本文中,我们将介绍如何将 PHP 格式的文档转换...
    99+
    2023-05-14
    php
  • 如何使用C#/VB.NET实现将PDF转为Word
    本篇内容介绍了“如何使用C#/VB.NET实现将PDF转为Word”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!固定布局模式转换速度快,有利...
    99+
    2023-07-04
  • java怎么将Word文档转为HTML
    Java 是一种广泛使用的编程语言,它可以通过编写代码实现进行各种计算和数据处理任务。在 Java 中,我们可以使用不同的 API 实现将 Word 文档转换为 HTML。在这篇文章中,我们将着重讨论使用 Apache POI(Java A...
    99+
    2023-05-14
  • 如何在java中使用openoffice将office文档转换为PDF
    如何在java中使用openoffice将office文档转换为PDF?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。Java的特点有哪些Java的特点有哪些1....
    99+
    2023-05-30
    java openoffice office
  • Go语言中实现将PDF文件转换为Word文档的实用方法
    Go语言实现PDF转Word文档的实用方法 前言 PDF和Word是两种常用的文档格式,在不同的场景下有不同的用途。PDF格式的文档具有跨平台兼容性好、安全性高、易于存储和传输等优点,而Word格式的文档则具...
    99+
    2024-01-31
    go语言 pdf word office
  • 怎么将xdf文件转换为word文档
    这篇文章将为大家详细讲解有关怎么将xdf文件转换为word文档,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。把xdf文件转为word文档的方法找到一篇XDF文档,并使用稻壳阅读器打开打开xd...
    99+
    2023-06-14
  • Python一键实现PDF文档批量转Word
    目录实现效果环境准备代码实现无论是在工作还是学习当中,大家都会遇到这样一个问题,将“PDF当中的内容(文本和图片)转换为Word的格式”,也就是说从只读转换成...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作