惊呆同事的自动化小工具来了!一键实现批量将 PDF 文档转 Word

无论是惊呆具键将在工作还是学习当中,大家都会遇到这样一个问题,同事将“PDF当中的自动化内容(文本和图片)转换为Word的格式”,也就是小工说从只读转换成可编辑的格式。网上绝大多数的实现工具也都是收费的,今天小编就给大家制作了一款批量将PDF文件转换为Word的批量神器,使用起来也是文档相当的方便。
实现效果我们首先来看一下出来的云服务器惊呆具键将效果,如下图所示:






用到的同事模块叫做pdf2docx,我们通过pip命令进行下载,自动化如下:
pip install pdf2docx后续我们还可以为py文件打包,小工用到的实现库是pyinstaller:
pip install pyinstaller代码实现我们先简单地实现将单个PDF文档转换成Word文档,代码如下:
from pdf2docx import Converter
cv = Converter(r"pdf文件的批量路径")
cv.convert("test.docx", start=0,end=None)
cv.close()那么上面的是单个PDF文件,要是文档涉及到是多个PDF文件,则需要用到遍历上传过来的惊呆具键将每一个文件,用到for循环遍历:
def startAction(self):
output_path_1 = Path.joinpath(Path.home(), "Desktop")
output_path_2 = str(output_path_1) + "\\output"
if not os.path.exists(output_path_2):
os.mkdir(output_path_2)
for path_list in pdfPath_list:
print("路径: ", path_list)
name = path_list.split("/")[-1].split(".")[0]
cv = Converter(path_list)
cv.convert(output_path_2 + "\\{}.docx".format(name), start=0, end=None)
cv.close()
msg_box = QMessageBox(QMessageBox.Information, 完成, 提取完成, QMessageBox.Yes)
msg_box.exec_()上述的代码,香港云服务器我们首先将指定好输出的Word文档的位置,这里小编设置的是在桌面,然后通过for循环去遍历处理每一个PDF文档,当所有的步骤都完成的时候,提示我们已经完成了。当然整个可视化界面当中还有一个上传文件的功能,代码如下:
# 选择本地文件上传
def uploadFiles(self):
global pdfPath_list # 这里为了方便别的地方引用文件路径,将其设置为全局变量
pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上传文件", r"路径", "*.pdf;;All Files(*)")
# 显示所选文件的路径
self.ui.lineEdit.setText(",".join(pdfPath_list))整体的代码如下所示:
from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog
from PySide2.QtUiTools import QUiLoader
from pdf2docx import Converter
from pathlib import Path
import os
class OCRQt:
def __init__(self):
self.ui = QUiLoader().load(pdf2word.ui)
self.ui.pushButton.clicked.connect(self.uploadFiles)
self.ui.pushButton_2.clicked.connect(self.startAction)
def uploadFiles(self):
........
........
def startAction(self):
.......
.......
if __name__ == __main__:
app = QApplication([])
# 显示创建的界面
MainWindow = OCRQt() # 创建窗体对象
MainWindow.ui.show() # 显示窗体
app.exit(app.exec_()) # 程序关闭时退出进程云南idc服务商相关文章
设计你的个性电脑——煲音箱电脑贴纸教程(从零开始,打造独一无二的音箱电脑)
摘要:电脑已经成为我们生活中不可或缺的一部分,而自定义电脑外观是展示个人风格的重要方式之一。本文将带你一步步学习如何设计和制作煲音箱电脑贴纸,让你的电脑焕发出独特的魅力。1.挑选...2025-11-05
本文转载自微信公众号「木鸟杂记」,作者穆尼奥。转载本文请联系木鸟杂记公众号。分布式系统有很多经典的套路,也即设计模式。每个设计模式可以解决经典的一类问题,积累的多了,便可以稍加变化,进行取舍,设计出贴2025-11-05
一 什么是 Netty? 能做什么?Netty 是一个致力于创建高性能网络应用程序的成熟的 IO 框架。相比较与直接使用底层的 Java IO API,你不需要先成为网络专家就可以基于 Netty 去2025-11-05
用户态进程/线程的创建 Fork/vfork/Pthread_Create
forkfork 函数创建子进程成功后,父进程返回子进程的 pid,子进程返回0。具体描述如下:fork返回值为-1, 代表创建子进程失败 fork返回值为0,代表子进程创建成功,这个分2025-11-05如何自动生成Word文档目录的序号(简便有效的方法让你省时省力)
摘要:在撰写长篇文档时,我们常常需要添加目录以方便读者阅读。然而,手动为目录添加序号是一项繁琐而耗时的任务。本文将介绍一种简便有效的方法,帮助你轻松自动生成Word文档目录的序号,让你节...2025-11-05
通常大家都是在自己的电脑上跑程序,直接是可以可视化相应的结果。如果是在服务器上的话,使用终端,是不太方便查看结果。今天,小F就给大家介绍4个可以在命令行中使用的Python库。分别是Bashplotl2025-11-05

最新评论