在 Python 中,你可以使用 PyPDF2 库来拆分 PDF 文件。以下是一个简单的示例,演示如何将一个 PDF 文件拆分为多个单页 PDF 文件。
首先,你需要安装 PyPDF2 库。如果尚未安装,可以使用以下命令进行安装:
pip install PyPDF2
然后,可以使用以下代码来拆分 PDF 文件:
import PyPDF2
def split_pdf(input_pdf_path, output_folder):
# 打开输入的 PDF 文件
with open(input_pdf_path, "rb") as input_pdf_file:
# 创建一个 PdfFileReader 对象
pdf_reader = PyPDF2.PdfFileReader(input_pdf_file)
# 获取 PDF 文件的总页数
num_pages = pdf_reader.numPages
# 遍历每一页
for page_number in range(num_pages):
# 创建一个 PdfFileWriter 对象
pdf_writer = PyPDF2.PdfFileWriter()
# 将当前页添加到 PdfFileWriter 对象
pdf_writer.addPage(pdf_reader.getPage(page_number))
# 创建输出文件路径
output_pdf_path = f"{output_folder}/page_{page_number + 1}.pdf"
# 将当前页写入新的 PDF 文件
with open(output_pdf_path, "wb") as output_pdf_file:
pdf_writer.write(output_pdf_file)
print(f"已保存: {output_pdf_path}")
# 示例使用
input_pdf_path = "input.pdf" # 输入 PDF 文件的路径
output_folder = "output_pages" # 输出文件夹的路径
split_pdf(input_pdf_path, output_folder)
请确保将 input.pdf
和 output_pages
替换为实际的输入文件路径和输出文件夹路径。运行此代码后,PDF 文件将被拆分为多个单页 PDF 文件,并保存到指定的输出文件夹中。