在 Python 中從 Word 中提取頁面

從 Word 文檔中提取頁面在 Python 中可以幫助您孤立內容、分享部分或準備摘要。Aspose.Words for Python 使這項任務變得高效且簡單。在本博客文章中,您將學習如何使用 Python 從 Word 文檔中提取單個或多個頁面。

我們將討論以下主題:

Python Word Page Extractor Library

我們將使用 Aspose.Words for Python 來從 Word 文檔中提取頁面。這是一個強大的 Word 文檔自動化庫。它支持文檔生成、編輯、轉換和提取。該庫使您能夠以高精度從 Word 文件中提取特定頁面。

要開始使用 Aspose.Words for Python,您需要安裝 SDK。請從 releases 下載,或使用以下 pip 命令直接安裝:

pip install aspose-words

提取 Python 中 Word 文檔的頁面

您可以通過以下步驟從 Word 文件中提取特定頁面:

  1. 使用 Document 類別加載 Word 文檔。
  2. 使用 pagecount 獲取總頁數。
  3. 循環遍歷文檔中的每一頁。
  4. 使用 extractpages() 方法一次提取一頁。
  5. 將每個提取的頁面另存為單獨的 .docx 文件。

這裡有一段示範從 Word 文件中提取頁面的程式碼範例。

import aspose.words as aw

# load Word document
doc = aw.Document("sample-multi-page.docx")

# get page count
pageCount = doc.page_count

# loop through pages
for page in range(0, pageCount):
    # 將每一頁保存為單獨的文件
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"split_by_page_{page + 1}.docx")
在 Python 中從 Word 文檔中提取一頁

在 Python 中提取 Word 文檔中的一頁

從 Word 文件中提取頁面範圍的 Python 程式

您也可以按照以下步驟從 Word 文件中提取一系列頁面:

  1. 使用 Document 類別加載 Word 文檔。
  2. 使用 extractpages() 方法提取一系列頁面。
  3. 將提取的頁面保存為新的 .docx 文件。

這是它的運作方式:

import aspose.words as aw

# load Word document
doc = aw.Document("sample-multi-page.docx")

# 提取頁面範圍
extractedPages = doc.extract_pages(3, 2)

# 將頁面另存為單獨文件
extractedPages.save("split_by_page_range.docx")
在 Python 中從 Word 文件擷取頁面範圍

從 Word 文件中提取範圍頁面在 Python 中

獲取免費許可證

要無限制地評估 Aspose.Words 的完整功能, 獲取免費臨時許可證。這很快且方便。

在線分割 Word 文檔

嘗試我們的 free online Word document splitter。上傳您的檔案,選擇您想要的拆分方式,並立即下載結果。

Image

從 Word 文件中提取頁面:免費資源

探索更多這些有用的連結:

結論

在這篇博客文章中,您學會了如何使用 Aspose.Words for Python 從 Word 文檔提取頁面。我們介紹了提取單個頁面、特定頁面範圍以及將整個文檔拆分為單獨文件的方法。它有助於使用 Python 自動化您的文檔處理任務。

如果您有問題或需要幫助,請訪問我們的 support forum

看也許