تحتوي الصور غالبًا على نصوص قيمة، لكن استخراجها من تنسيقات مثل JPG ليس مهمة بسيطة. في هذا المنشور، ستتعلم كيفية استخراج نص JPG باستخدام بايثون. لا يهم إذا كنت تقوم بأتمتة معالجة الوثائق أو رقمنة المواد المطبوعة، فهذه الحلول توفر لك نتائج سريعة ودقيقة.

ما هو نص JPG؟

نص JPG هو أي نص مرئي مضمن في ملف صورة .jpg أو .jpeg. يمكن أن يكون على شكل:

  • المستندات الممسوحة ضوئياً
  • لقطات شاشة من الكمبيوتر المكتبي أو الهاتف المحمول
  • صور للافتات أو التسميات أو الإيصالات
  • بطاقات العمل والنماذج المكتوبة باليد

لأن النص في ملف JPG يتم تخزينه كبيكسلات، يجب تحويله إلى نص يمكن للآلة قراءته باستخدام تقنية التعرف على الأحرف الضوئية (OCR).استخراج النص من صور JPG مفيد لأسباب متعددة. يساعد في تحويل الوثائق الورقية إلى صيغة رقمية، وأتمتة إدخال البيانات من النماذج، وجعل محتوى الصور قابلاً للبحث. يمكنك أيضاً استخدام النص المستخرج في رمز لمزيد من التحليل. مع تكنولوجيا OCR، توفر الوقت وتقلل من الحاجة إلى العمل اليدوي في أي مهمة تتعلق بمعلومات قائمة على الصور.

Aspose.OCR: مستخرج نص JPG

تعد تقنية التعرف الضوئي على الأحرف (OCR) هي الطريقة الوحيدة الموثوقة لاستخراج النص من صورة JPG. في هذه التدوينة، سنستخدم Aspose.OCR for Python لاستخراج نص JPG. إنها مكتبة مستقلة مصممة للمطورين، وتقدم الفوائد الرئيسية التالية:

  • المعالجة المسبقة المدمجة (تصحيح الميل، التbinirization، تصفية الضوضاء)
  • التعرف عالي السرعة وعالي الدقة
  • دعم لعدة تنسيقات إخراج: نص عادي، JSON، PDF
  • متاحة لـ Python و Java و .NET و C++

يطور Aspose.OCR بشكل تلقائي خطوط الكتابة، والأحجام، وحتى النصوص المائلة، مما يجعله مثالياً للحالات البسيطة والمتقدمة. يقوم بفحص صور JPG بحثاً عن نصوص مطبوعة أو مكتوبة بخط اليد، ويكتشف مناطق النص في التخطيطات المعقدة، ويستخرج المحتوى متعدد اللغات من الصور.

كيفية استخراج نص JPG في بايثون

خطوة ١: تثبيت Aspose.OCR

ثبت المكتبة من PyPI باستخدام أمر pip التالي:

pip install aspose-ocr-python-net 

يمكنك أيضًا تنزيل الحزمة من الإصدارات.

الخطوة 2: قراءة نص JPG باستخدام الرمز

import aspose.ocr as ocr

# قم بتثبيت واجهة برمجة التطبيقات Aspose.OCR
api = ocr.AsposeOcr()

# أضف صورة إلى دفعة التعرف
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# تعرف على الصورة
result = api.recognize(img)

# Print recognition result
print(result[0].recognition_text)

صورة عينة

اقرأ نص JPG باستخدام Aspose.OCR for Python.

اقرأ نص JPG باستخدام Aspose.OCR for Python.

Output

Lorem ipsum dolor sit amet,consectetuer adipiscing elit,
sed diam nonummy nibh euismod tincidunt ut laoreet
dolore magna aliguam erat volutpat.Ut wisi enim ad
minim veniam,quis nostrud exerci tation ullamcorper sus-
cipit lobortis nisl ut aliquip ex ea commodo consequat.
Duis autem vel eum iriure dolor in hendrerit in vulputate
velit esse molestie consequat,vel illum dolore eu feugiat
nulla facilisis at vero eros et accumsan et iusto odio

قم بتحويل نص JPG إلى Word باستخدام بايثون

يمكنك تحويل نص JPG مباشرة إلى مستند Microsoft Word قابل للتحرير من خلال اتباع الخطوات المذكورة سابقًا. ومع ذلك، تحتاج فقط إلى حفظ النص المستخرج في ملف .docx باستخدام بايثون:

import aspose.ocr as ocr

# إنشاء كائن API لـ Aspose.OCR
api = ocr.AsposeOcr()

# أضف صورة إلى دفعة التعرف
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# تعرف على الصورة
result = api.recognize(img)

# Print recognition result
print(result[0].recognition_text)

# Save as DOCX
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX, ocr.PdfOptimizationMode.NONE)
Convert JPG Text to Word using Python.

قم بتحويل نص JPG إلى Word باستخدام بايثون.

جرب Aspose.OCR اليوم

قم بزيارة صفحتنا Temporary License للحصول على رخصة مجانية بسرعة وفتح الوصول الكامل إلى مكتبة Aspose.OCR بايثون.

نص JPG مع Aspose.OCR - موارد مجانية

بالإضافة إلى قراءة واستخراج نصوص JPG، استكشف الموارد أدناه. اكتشف المزيد عن ميزات المكتبة وقدراتها.

خاتمة

استخراج النص من JPG بسيط وفعال مع Aspose.OCR for Python. يوفر واجهة برمجة تطبيقات نظيفة للتعرف على النصوص وتحويلها من ملفات الصور. يمكنك دمجه بسهولة في أنظمتك الحالية لأغراض الأتمتة والبحث والتحرير. إذا كان لديك أي أسئلة، فلا تتردد في التواصل معنا في منتدى الدعم المجاني.

انظر أيضا