
Việc trích xuất các trang từ tài liệu Word trong Python có thể giúp bạn phân lập nội dung, chia sẻ các phần hoặc chuẩn bị tóm tắt. Aspose.Words for Python làm cho nhiệm vụ này trở nên hiệu quả và dễ dàng. Trong bài viết blog này, bạn sẽ học cách trích xuất một hoặc nhiều trang từ tài liệu Word bằng Python.
Chúng tôi sẽ đề cập đến các chủ đề sau:
- Thư viện Trích xuất Trang Từ Python
- Trích xuất một trang từ tài liệu Word
- Trích Xuất Một Phạm Vi Trang từ Tệp Word
- Chia tách tài liệu Word trực tuyến
- Tài nguyên miễn phí
Thư viện Trích Xuất Trang Word Python
Chúng tôi sẽ sử dụng Aspose.Words for Python để trích xuất các trang từ tài liệu Word. Đây là một thư viện mạnh mẽ cho tự động hóa tài liệu Word. Nó hỗ trợ tạo tài liệu, chỉnh sửa, chuyển đổi và trích xuất. Thư viện cho phép bạn trích xuất các trang cụ thể từ các tệp Word với độ chính xác cao.
Để bắt đầu với Aspose.Words for Python, bạn cần cài đặt SDK. Vui lòng tải nó từ releases hoặc đơn giản cài đặt nó bằng cách sử dụng lệnh pip:
pip install aspose-words
Trích xuất một trang từ tài liệu Word trong Python
Bạn có thể trích xuất một trang cụ thể từ tài liệu Word bằng cách làm theo các bước dưới đây:
- Tải tài liệu Word bằng cách sử dụng lớp
Document
. - Lấy tổng số trang sử dụng
pagecount
. - Lặp qua từng trang trong tài liệu.
- Trích xuất một trang tại một thời điểm bằng cách sử dụng phương thức
extractpages()
. - Lưu mỗi trang được trích xuất dưới dạng một tệp
.docx
riêng biệt.
Dưới đây là một đoạn mã mẫu minh họa việc trích xuất trang từ một tài liệu Word.
import aspose.words as aw
# load Word document
doc = aw.Document("sample-multi-page.docx")
# get page count
pageCount = doc.page_count
# duyệt qua các trang
for page in range(0, pageCount):
# lưu mỗi trang dưới dạng tài liệu riêng biệt
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"split_by_page_{page + 1}.docx")

Trích xuất một trang từ tài liệu Word bằng Python
Trích xuất một khoảng trang từ tệp Word trong Python
Bạn cũng có thể trích xuất một khoảng trang từ tệp Word bằng cách làm theo các bước dưới đây:
- Tải tài liệu Word bằng cách sử dụng lớp
Document
. - Trích xuất một phạm vi trang bằng cách sử dụng phương thức
extractpages()
. - Lưu các trang đã trích xuất dưới dạng tệp
.docx
mới.
Đây là cách nó hoạt động:
import aspose.words as aw
# load Word document
doc = aw.Document("sample-multi-page.docx")
# trích xuất khoảng trang
extractedPages = doc.extract_pages(3, 2)
# lưu trang dưới dạng tài liệu riêng biệt
extractedPages.save("split_by_page_range.docx")

Trích xuất một Dải Trang từ Tệp Word trong Python
Nhận Giấy phép Miễn phí
Để đánh giá đầy đủ các tính năng của Aspose.Words mà không bị giới hạn, nhận giấy phép tạm thời miễn phí.Nó nhanh chóng và dễ dàng.
Chia tách tài liệu Word Online
Hãy thử trình tách tài liệu Word trực tuyến miễn phí.Tải lên tệp của bạn, chọn cách bạn muốn tách nó, và ngay lập tức tải xuống kết quả.

Tài liệu Word: Tài nguyên miễn phí
Khám phá thêm với những liên kết hữu ích này:
Kết luận
Trong bài viết trên blog này, bạn đã học cách trích xuất các trang từ tài liệu Word bằng cách sử dụng Aspose.Words for Python. Chúng tôi đã đề cập đến các phương pháp để trích xuất một trang duy nhất, một khoảng các trang cụ thể và chia tài liệu thành nhiều tệp riêng biệt. Nó giúp tự động hóa các tác vụ xử lý tài liệu của bạn bằng Python.
Nếu bạn có câu hỏi hoặc cần trợ giúp, hãy truy cập hỗ trợ diễn đàn.