Python – PyPDF2模块的简单使用
1.简介
PyPDF的前身是PyPDF包在2005年发布,该包的最后一个版本发布于2010年,后来大约经过一年左右,名为Phasit的公司赞助PyPDF的一个分支后来命名为PyPDF2,两个版本功能都基本一样,最大的区别就是PyPDF2中加入了支持Python3功能。后面又出现了PyPDF3、PyPDF4等不同版本,但这些包并没有对PyPDF2功能向后完全兼容,受欢迎程度当然也不如PyPDF2。
2.安装
使用命令:pip install pypdf2。
3.应用1:将单个PDF拆分为多个PDF文件
#! /usr/bin/env python3
# -*- coding:utf-8 -*-
# Author : MaYi
# Blog : http://www.cnblogs.com/mayi0312/
# Date : 2022-08-19
# Name : test01
# Software : PyCharm
# Note : 使用PyPDF2模块将单个PDF拆分为多个PDF文件
# 导入模块
from PyPDF2 import PdfFileReader, PdfFileWriter
# pdf 文档
pdf_name = "test.pdf"
pdf_reader = PdfFileReader(pdf_name)
# PDF页数
page_num = pdf_reader.getNumPages()
i_count = 0 # 计数
for i in range(0, page_num, 20):
# 每20页拆分成一个新的PDF文件
i_count += 1
pdf_writer = PdfFileWriter()
for j in range(i, min(i + 20, page_num)):
pdf_writer.addPage(pdf_reader.getPage(j))
save_pdf_name = str(i_count).zfill(3) + ".pdf"
with open(save_pdf_name, "wb") as fo:
pdf_writer.write(fo)


