تصاویر اغلب حاوی متنهای با ارزش هستند، اما استخراج آن از فرمتهایی مانند JPG کار سادهای نیست. در این پست، شما یاد خواهید گرفت که چگونه متن JPG را با استفاده از Python استخراج کنید. مهم نیست که شما در حال اتوماسیون پردازش اسناد هستید یا مادهای چاپی را دیجیتال میکنید، این راهحل نتایج سریع و دقیقی به شما میدهد.
JPG متن چیست؟
متن JPG هر متن قابل مشاهدهای است که در یک فایل تصویر .jpg
یا .jpeg
جاسازی شده است. این متن میتواند به شکلهای زیر باشد:
- مدارک اسکن شده
- تصاویر صفحهنمایش از دسکتاپ یا موبایل
- عکسهای تابلوها، برچسبها یا رسیدها
- کارتهای ویزیت و فرمهای دستنویس
از آنجایی که متن در یک تصویر JPG به صورت پیکسلها ذخیره میشود، باید با استفاده از OCR (شناسایی کاراکتر نوری) به متنی قابل خواندن توسط ماشین تبدیل شود. استخراج متن از تصاویر JPG به دلایل مختلفی مفید است. این کار به دیجیتالسازی اسناد کاغذی، خودکار کردن ورود دادهها از فرمها و قابل جستجو کردن محتوای تصاویر کمک میکند. همچنین میتوانید از متن استخراج شده در یک کد برای تحلیلهای بیشتر استفاده کنید. با استفاده از فناوری OCR، زمان خود را صرفهجویی کرده و نیاز به کار دستی را در هر وظیفهای که شامل اطلاعات مبتنی بر تصویر است کاهش میدهید.
Aspose.OCR: استخراج متن JPG
OCR (تشخیص کاراکتر نوری) تنها راه قابل اعتماد برای استخراج متن از یک تصویر JPG است. در این پست وبلاگ، ما از Aspose.OCR برای پایتون برای استخراج متن JPG استفاده خواهیم کرد. این کتابخانه مستقل برای توسعهدهندگان طراحی شده است و مزایای کلیدی زیر را ارائه میدهد:
- پیش پردازش داخلی (تصحیح زاویه، باینری کردن، فیلتر کردن نویز)
- شناسایی با دقت بالا و سرعت بالا
- پشتیبانی از فرمتهای خروجی متعدد: متن ساده، JSON، PDF
- برای پایتون، جاوا، .NET و C++ در دسترس است
Aspose.OCR به طور خودکار فونتها، اندازهها و حتی متنهای چرخیده را شناسایی میکند و آن را برای استفادههای ساده و پیشرفته ایدهآل میسازد. این ابزار تصاویر JPG را برای متنهای تایپ شده یا دستنویس اسکن میکند، مناطق متنی را در طرحهای پیچیده شناسایی میکند و محتوای چند زبانه را از تصاویر استخراج میکند.
چگونه متن JPG را در پایتون استخراج کنیم
مرحله 1: نصب Aspose.OCR
کتابخانه را از PyPI با استفاده از فرمان pip زیر نصب کنید:
pip install aspose-ocr-python-net
شما همچنین میتوانید بسته را از releases دانلود کنید.
مرحله 2: خواندن متن JPG با کد
import aspose.ocr as ocr
# نسخهبرداری از API Aspose.OCR
api = ocr.AsposeOcr()
# تصویر را به دسته شناسایی اضافه کنید
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")
# شناسایی تصویر
result = api.recognize(img)
# نتیجه شناسایی را چاپ کنید
print(result[0].recognition_text)
تصویر نمونه

متن JPG را با Aspose.OCR برای پایتون بخوانید.
خروجی
Lorem ipsum dolor sit amet,consectetuer adipiscing elit,
sed diam nonummy nibh euismod tincidunt ut laoreet
dolore magna aliguam erat volutpat.Ut wisi enim ad
minim veniam,quis nostrud exerci tation ullamcorper sus-
cipit lobortis nisl ut aliquip ex ea commodo consequat.
Duis autem vel eum iriure dolor in hendrerit in vulputate
velit esse molestie consequat,vel illum dolore eu feugiat
nulla facilisis at vero eros et accumsan et iusto odio
متن JPG را با استفاده از پایتون به ورد تبدیل کنید
شما میتوانید متن JPG را بهطور مستقیم به یک سند ویرایشی مایکروسافت ورد تبدیل کنید با دنبال کردن مراحل ذکر شده قبلاً. با این حال، شما فقط نیاز دارید که متن استخراج شده را در یک فایل .docx
با استفاده از Python ذخیره کنید:
import aspose.ocr as ocr
# ایجاد نمونه API Aspose.OCR
api = ocr.AsposeOcr()
# تصویر را به دسته شناسایی اضافه کنید
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")
# تصویر را شناسایی کنید
result = api.recognize(img)
# نتیجه شناسایی را چاپ کنید
print(result[0].recognition_text)
# ذخیره به عنوان DOCX
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX, ocr.PdfOptimizationMode.NONE)

متن JPG را با استفاده از پایتون به Word تبدیل کنید.
امروز Aspose.OCR را امتحان کنید
به صفحه Temporary License ما مراجعه کنید تا به سرعت یک مجوز رایگان بدست آورید و دسترسی کامل به کتابخانه Aspose.OCR Python را آزاد کنید.
متن JPG با Aspose.OCR – منابع رایگان
علاوه بر خواندن و استخراج متن JPG، منابع زیر را بررسی کنید. در مورد ویژگیها و قابلیتهای کتابخانه بیشتر بدانید.
نتیجهگیری
استخراج متن JPG با Aspose.OCR برای پایتون ساده و مؤثر است. این ابزار یک API تمیز برای شناسایی و تبدیل متن از فایلهای تصویری فراهم میکند. شما میتوانید به راحتی آن را به سیستمهای موجود خود برای اتوماسیون، جستجو و ویرایش یکپارچه کنید. اگر سوالی دارید، لطفاً با ما در free support forum تماس بگیرید.