Python怎样将PDF拆分成多个文件

在 Python 中,你可以使用 PyPDF2 库来拆分 PDF 文件。以下是一个简单的示例,演示如何将一个 PDF 文件拆分为多个单页 PDF 文件。

首先,你需要安装 PyPDF2 库。如果尚未安装,可以使用以下命令进行安装:

pip install PyPDF2

然后,可以使用以下代码来拆分 PDF 文件:

import PyPDF2

def split_pdf(input_pdf_path, output_folder):
    # 打开输入的 PDF 文件
    with open(input_pdf_path, "rb") as input_pdf_file:
        # 创建一个 PdfFileReader 对象
        pdf_reader = PyPDF2.PdfFileReader(input_pdf_file)
        # 获取 PDF 文件的总页数
        num_pages = pdf_reader.numPages

        # 遍历每一页
        for page_number in range(num_pages):
            # 创建一个 PdfFileWriter 对象
            pdf_writer = PyPDF2.PdfFileWriter()
            # 将当前页添加到 PdfFileWriter 对象
            pdf_writer.addPage(pdf_reader.getPage(page_number))

            # 创建输出文件路径
            output_pdf_path = f"{output_folder}/page_{page_number + 1}.pdf"
            # 将当前页写入新的 PDF 文件
            with open(output_pdf_path, "wb") as output_pdf_file:
                pdf_writer.write(output_pdf_file)

            print(f"已保存: {output_pdf_path}")

# 示例使用
input_pdf_path = "input.pdf"  # 输入 PDF 文件的路径
output_folder = "output_pages"  # 输出文件夹的路径
split_pdf(input_pdf_path, output_folder)

请确保将 input.pdfoutput_pages 替换为实际的输入文件路径和输出文件夹路径。运行此代码后,PDF 文件将被拆分为多个单页 PDF 文件,并保存到指定的输出文件夹中。

Leave a Comment