Trích xuất trang từ Word trong Python

Việc trích xuất các trang từ tài liệu Word trong Python có thể giúp bạn phân lập nội dung, chia sẻ các phần hoặc chuẩn bị tóm tắt. Aspose.Words for Python làm cho nhiệm vụ này trở nên hiệu quả và dễ dàng. Trong bài viết blog này, bạn sẽ học cách trích xuất một hoặc nhiều trang từ tài liệu Word bằng Python.

Chúng tôi sẽ đề cập đến các chủ đề sau:

Thư viện Trích Xuất Trang Word Python

Chúng tôi sẽ sử dụng Aspose.Words for Python để trích xuất các trang từ tài liệu Word. Đây là một thư viện mạnh mẽ cho tự động hóa tài liệu Word. Nó hỗ trợ tạo tài liệu, chỉnh sửa, chuyển đổi và trích xuất. Thư viện cho phép bạn trích xuất các trang cụ thể từ các tệp Word với độ chính xác cao.

Để bắt đầu với Aspose.Words for Python, bạn cần cài đặt SDK. Vui lòng tải nó từ releases hoặc đơn giản cài đặt nó bằng cách sử dụng lệnh pip:

pip install aspose-words

Trích xuất một trang từ tài liệu Word trong Python

Bạn có thể trích xuất một trang cụ thể từ tài liệu Word bằng cách làm theo các bước dưới đây:

  1. Tải tài liệu Word bằng cách sử dụng lớp Document.
  2. Lấy tổng số trang sử dụng pagecount.
  3. Lặp qua từng trang trong tài liệu.
  4. Trích xuất một trang tại một thời điểm bằng cách sử dụng phương thức extractpages().
  5. Lưu mỗi trang được trích xuất dưới dạng một tệp .docx riêng biệt.

Dưới đây là một đoạn mã mẫu minh họa việc trích xuất trang từ một tài liệu Word.

import aspose.words as aw

# load Word document
doc = aw.Document("sample-multi-page.docx")

# get page count
pageCount = doc.page_count

# duyệt qua các trang
for page in range(0, pageCount):
    # lưu mỗi trang dưới dạng tài liệu riêng biệt
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"split_by_page_{page + 1}.docx")
Trích xuất một Trang từ Tài liệu Word trong Python

Trích xuất một trang từ tài liệu Word bằng Python

Trích xuất một khoảng trang từ tệp Word trong Python

Bạn cũng có thể trích xuất một khoảng trang từ tệp Word bằng cách làm theo các bước dưới đây:

  1. Tải tài liệu Word bằng cách sử dụng lớp Document.
  2. Trích xuất một phạm vi trang bằng cách sử dụng phương thức extractpages().
  3. Lưu các trang đã trích xuất dưới dạng tệp .docx mới.

Đây là cách nó hoạt động:

import aspose.words as aw

# load Word document
doc = aw.Document("sample-multi-page.docx")

# trích xuất khoảng trang
extractedPages = doc.extract_pages(3, 2)

# lưu trang dưới dạng tài liệu riêng biệt
extractedPages.save("split_by_page_range.docx")
Trích xuất một dải trang từ tệp Word trong Python

Trích xuất một Dải Trang từ Tệp Word trong Python

Nhận Giấy phép Miễn phí

Để đánh giá đầy đủ các tính năng của Aspose.Words mà không bị giới hạn, nhận giấy phép tạm thời miễn phí.Nó nhanh chóng và dễ dàng.

Chia tách tài liệu Word Online

Hãy thử trình tách tài liệu Word trực tuyến miễn phí.Tải lên tệp của bạn, chọn cách bạn muốn tách nó, và ngay lập tức tải xuống kết quả.

Image

Tài liệu Word: Tài nguyên miễn phí

Khám phá thêm với những liên kết hữu ích này:

Kết luận

Trong bài viết trên blog này, bạn đã học cách trích xuất các trang từ tài liệu Word bằng cách sử dụng Aspose.Words for Python. Chúng tôi đã đề cập đến các phương pháp để trích xuất một trang duy nhất, một khoảng các trang cụ thể và chia tài liệu thành nhiều tệp riêng biệt. Nó giúp tự động hóa các tác vụ xử lý tài liệu của bạn bằng Python.

Nếu bạn có câu hỏi hoặc cần trợ giúp, hãy truy cập hỗ trợ diễn đàn.

Xem Thêm