صفحات را از ورد در پایتون استخراج کنید

استخراج صفحات از یک سند ورد در پایتون می‌تواند به شما کمک کند تا محتوا را جدا کرده، بخش‌ها را به اشتراک بگذارید یا خلاصه‌ها را آماده کنید. Aspose.Words برای پایتون این کار را کارآمد و آسان می‌کند. در این پست وبلاگ، شما یاد خواهید گرفت که چگونه یک یا چند صفحه از اسناد ورد را با استفاده از پایتون استخراج کنید.

ما موضوعات زیر را بررسی خواهیم کرد:

کتابخانه استخراج صفحه ورد پایتون

ما از Aspose.Words for Python برای استخراج صفحات از یک سند ورد استفاده خواهیم کرد. این یک کتابخانه قدرتمند برای اتوماسیون اسناد ورد است. این کتابخانه از تولید، ویرایش، تبدیل و استخراج اسناد پشتیبانی می‌کند. این کتابخانه به شما امکان می‌دهد صفحات خاصی را با دقت بالا از فایل‌های ورد استخراج کنید.

برای شروع به کار با Aspose.Words برای پایتون، شما نیاز به نصب SDK دارید. لطفاً آن را از releases دانلود کنید یا به سادگی با استفاده از دستور pip زیر نصب کنید:

pip install aspose-words

یک صفحه از یک سند ورد را در پایتون استخراج کنید.

شما می‌توانید یک صفحه خاص را از یک سند ورد با دنبال کردن مراحل زیر استخراج کنید:

  1. از کلاس Document برای بارگذاری سند Word استفاده کنید.
  2. تعداد کل صفحات را با استفاده از pagecount دریافت کنید.
  3. هر صفحه در سند را مرور کنید.
  4. یک صفحه را در هر بار با استفاده از متد extractpages() استخراج کنید.
  5. هر صفحه استخراج شده را به عنوان یک فایل جداگانه .docx ذخیره کنید.

در اینجا یک کد نمونه برای نمایش استخراج صفحه از یک سند ورد وجود دارد.

import aspose.words as aw

# بارگذاری سند Word
doc = aw.Document("sample-multi-page.docx")

# get page count
pageCount = doc.page_count

# از صفحات عبور کنید
for page in range(0, pageCount):
    # هر صفحه را به عنوان یک سند جداگانه ذخیره کنید.
    extractedPage = doc.extract_pages(page, 1)
    extractedPage.save(f"split_by_page_{page + 1}.docx")
از یک صفحه از یک سند Word در پایتون استخراج کنید

از یک صفحه در یک سند Word در پایتون استخراج کنید

از یک فایل ورد در پایتون یک بازه از صفحات را استخراج کنید

شما همچنین می‌توانید یک مجموعه صفحه از یک فایل Word را با دنبال کردن مراحل زیر استخراج کنید:

  1. از کلاس Document برای بارگذاری سند Word استفاده کنید.
  2. از متد extractpages() برای استخراج یک بازه از صفحات استفاده کنید.
  3. صفحات استخراج شده را به عنوان یک فایل .docx جدید ذخیره کنید.

این‌گونه کار می‌کند:

import aspose.words as aw

# load Word document
doc = aw.Document("sample-multi-page.docx")

# بُرد صفحات را استخراج کنید
extractedPages = doc.extract_pages(3, 2)

# صفحات را به عنوان یک سند جداگانه ذخیره کنید.
extractedPages.save("split_by_page_range.docx")
از یک فایل ورد در پایتون محدوده‌ای از صفحه‌ها را استخراج کنید.

از یک فایل ورد در پایتون محدوده‌ای از صفحات را استخراج کنید.

مجوز رایگان دریافت کنید

برای ارزیابی کامل ویژگی‌های Aspose.Words بدون محدودیت، گرفتن مجوز موقت رایگان.این کار سریع و آسان است.

مدیریت اسناد ورد آنلاین

سعی کنید مستند تقسیم کننده Word آنلاین رایگان ما را امتحان کنید. فایل خود را بارگذاری کنید، انتخاب کنید که چگونه می‌خواهید آن را تقسیم کنید و نتیجه را فوری دانلود کنید.

Image

از مستند ورد صفحات استخراج کنید: منابع رایگان

برای کاوش بیشتر با این لینک‌های مفید:

نتیجه گیری

در این پست وبلاگ، شما یاد گرفتید که چگونه صفحات را از اسناد Word با استفاده از Aspose.Words for Python استخراج کنید. ما روش‌هایی را برای استخراج یک صفحه، بازه مشخصی از صفحات و تقسیم کل سند به فایل‌های جداگانه پوشش دادیم. این به شما کمک می‌کند تا وظایف پردازش سند خود را با استفاده از Python خودکار کنید.

اگر سوالی دارید یا به کمک نیاز دارید، به support forum ما مراجعه کنید.

See Also