تصاویر اغلب حاوی متن‌های با ارزش هستند، اما استخراج آن از فرمت‌هایی مانند JPG کار ساده‌ای نیست. در این پست، شما یاد خواهید گرفت که چگونه متن JPG را با استفاده از Python استخراج کنید. مهم نیست که شما در حال اتوماسیون پردازش اسناد هستید یا ماده‌ای چاپی را دیجیتال می‌کنید، این راه‌حل نتایج سریع و دقیقی به شما می‌دهد.

JPG متن چیست؟

متن JPG هر متن قابل مشاهده‌ای است که در یک فایل تصویر .jpg یا .jpeg جاسازی شده است. این متن می‌تواند به شکل‌های زیر باشد:

  • مدارک اسکن شده
  • تصاویر صفحه‌نمایش از دسکتاپ یا موبایل
  • عکس‌های تابلوها، برچسب‌ها یا رسیدها
  • کارت‌های ویزیت و فرم‌های دست‌نویس

از آنجایی که متن در یک تصویر JPG به صورت پیکسل‌ها ذخیره می‌شود، باید با استفاده از OCR (شناسایی کاراکتر نوری) به متنی قابل خواندن توسط ماشین تبدیل شود. استخراج متن از تصاویر JPG به دلایل مختلفی مفید است. این کار به دیجیتال‌سازی اسناد کاغذی، خودکار کردن ورود داده‌ها از فرم‌ها و قابل جستجو کردن محتوای تصاویر کمک می‌کند. همچنین می‌توانید از متن استخراج شده در یک کد برای تحلیل‌های بیشتر استفاده کنید. با استفاده از فناوری OCR، زمان خود را صرفه‌جویی کرده و نیاز به کار دستی را در هر وظیفه‌ای که شامل اطلاعات مبتنی بر تصویر است کاهش می‌دهید.

Aspose.OCR: استخراج متن JPG

OCR (تشخیص کاراکتر نوری) تنها راه قابل اعتماد برای استخراج متن از یک تصویر JPG است. در این پست وبلاگ، ما از Aspose.OCR برای پایتون برای استخراج متن JPG استفاده خواهیم کرد. این کتابخانه مستقل برای توسعه‌دهندگان طراحی شده است و مزایای کلیدی زیر را ارائه می‌دهد:

  • پیش پردازش داخلی (تصحیح زاویه، باینری کردن، فیلتر کردن نویز)
  • شناسایی با دقت بالا و سرعت بالا
  • پشتیبانی از فرمت‌های خروجی متعدد: متن ساده، JSON، PDF
  • برای پایتون، جاوا، .NET و C++ در دسترس است

Aspose.OCR به طور خودکار فونت‌ها، اندازه‌ها و حتی متن‌های چرخیده را شناسایی می‌کند و آن را برای استفاده‌های ساده و پیشرفته ایده‌آل می‌سازد. این ابزار تصاویر JPG را برای متن‌های تایپ شده یا دست‌نویس اسکن می‌کند، مناطق متنی را در طرح‌های پیچیده شناسایی می‌کند و محتوای چند زبانه را از تصاویر استخراج می‌کند.

چگونه متن JPG را در پایتون استخراج کنیم

مرحله 1: نصب Aspose.OCR

کتابخانه را از PyPI با استفاده از فرمان pip زیر نصب کنید:

pip install aspose-ocr-python-net 

شما همچنین می‌توانید بسته را از releases دانلود کنید.

مرحله 2: خواندن متن JPG با کد

import aspose.ocr as ocr

# نسخه‌برداری از API Aspose.OCR
api = ocr.AsposeOcr()

# تصویر را به دسته شناسایی اضافه کنید
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# شناسایی تصویر
result = api.recognize(img)

# نتیجه شناسایی را چاپ کنید
print(result[0].recognition_text)

تصویر نمونه

متن JPG را با Aspose.OCR برای پایتون بخوانید.

متن JPG را با Aspose.OCR برای پایتون بخوانید.

خروجی

Lorem ipsum dolor sit amet,consectetuer adipiscing elit,
sed diam nonummy nibh euismod tincidunt ut laoreet
dolore magna aliguam erat volutpat.Ut wisi enim ad
minim veniam,quis nostrud exerci tation ullamcorper sus-
cipit lobortis nisl ut aliquip ex ea commodo consequat.
Duis autem vel eum iriure dolor in hendrerit in vulputate
velit esse molestie consequat,vel illum dolore eu feugiat
nulla facilisis at vero eros et accumsan et iusto odio

متن JPG را با استفاده از پایتون به ورد تبدیل کنید

شما می‌توانید متن JPG را به‌طور مستقیم به یک سند ویرایشی مایکروسافت ورد تبدیل کنید با دنبال کردن مراحل ذکر شده قبلاً. با این حال، شما فقط نیاز دارید که متن استخراج شده را در یک فایل .docx با استفاده از Python ذخیره کنید:

import aspose.ocr as ocr

# ایجاد نمونه API Aspose.OCR
api = ocr.AsposeOcr()

# تصویر را به دسته شناسایی اضافه کنید
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# تصویر را شناسایی کنید
result = api.recognize(img)

# نتیجه شناسایی را چاپ کنید
print(result[0].recognition_text)

# ذخیره به عنوان DOCX
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX, ocr.PdfOptimizationMode.NONE)
متن JPG را با استفاده از پایتون به ورد تبدیل کنید.

متن JPG را با استفاده از پایتون به Word تبدیل کنید.

امروز Aspose.OCR را امتحان کنید

به صفحه Temporary License ما مراجعه کنید تا به سرعت یک مجوز رایگان بدست آورید و دسترسی کامل به کتابخانه Aspose.OCR Python را آزاد کنید.

متن JPG با Aspose.OCR – منابع رایگان

علاوه بر خواندن و استخراج متن JPG، منابع زیر را بررسی کنید. در مورد ویژگی‌ها و قابلیت‌های کتابخانه بیشتر بدانید.

نتیجه‌گیری

استخراج متن JPG با Aspose.OCR برای پایتون ساده و مؤثر است. این ابزار یک API تمیز برای شناسایی و تبدیل متن از فایل‌های تصویری فراهم می‌کند. شما می‌توانید به راحتی آن را به سیستم‌های موجود خود برای اتوماسیون، جستجو و ویرایش یکپارچه کنید. اگر سوالی دارید، لطفاً با ما در free support forum تماس بگیرید.

همچنین ببینید