תמונות לעיתים קרובות מכילות טקסט יקר ערך, אך חילוץ שלו מ- JPG אינו משימה פשוטה. בפוסט הזה, תלמד כיצד לחלץ טקסט מ-JPG באמצעות פייתון. לא משנה אם אתה אוטומט את תהליך העיבוד של מסמכים או דיגיטציה של חומר מודפס, הפתרון הזה נותן לך תוצאות מהירות ומדויקות.

What Is JPG Text?

JPG text הוא כל טקסט גלוי המשולב בקובץ תמונה .jpg או .jpeg. הוא יכול להיות בצורת:

  • מסמכים סרוקים
  • צילומי מסך מהמחשב השולחני או מהטלפון הנייד
  • תמונות של שלטים, תוויות או קבלות
  • כרטיסי ביקור וטפסים כתובים ביד

מאחר שהטקסט ב-JPG מאוחסן כפיקסלים, יש להמיר אותו לטקסט קריא במכונה באמצעות OCR (זיהוי תווים אופטי).חישוב טקסט מתמונות JPG שימושי למגוון סיבות. זה עוזר לדיגיטציה של מסמכים מודפסים, אוטומציה של הזנת נתונים מטפסים, ולעשות את תוכן התמונה בר-חיפוש. אתה יכול גם להשתמש בטקסט המופק בקוד לניתוח נוסף. עם טכנולוגיית OCR, אתה חוסך זמן ומפחית את הצורך בעבודה ידנית בכל משימה שמעורבת בה מידע מבוסס תמונה.

Aspose.OCR: חילוץ טקסט מ-JPG

OCR (זיהוי תו מסוג אופטי) היא הדרך האמינה היחידה לחלץ טקסט מתמונה בפורמט JPG. בפוסט בלוג זה, נשתמש ב-Aspose.OCR עבור Python כדי לחלץ טקסט מסוג JPG. זו ספרייה עצמאית המיועדת למפתחים, המציעה את היתרונות המרכזיים הבאים:

  • עיבוד מקדים מובנה (תיקון skew, בינריזציה, סינון רעש)
  • זיהוי מהיר מאוד, מדויק מאוד
  • תמיכה בפורמטים מרובים של פלט: טקסט פשוט, JSON, PDF
  • זמין עבור Python, Java, .NET, ו-C++

Aspose.OCR מזהה אוטומטית גופנים, גדלים ואפילו טקסטים מסובבים, מה שהופך אותו לאידיאלי עבור שימושים פשוטים ומתקדמים. הוא סורק תמונות JPG עבור טקסט מודפס או כתוב ביד, מזהה אזורי טקסט בתצורות מורכבות ומחצין תוכן רב-לשוני מתמונות.

איך לחלץ טקסט מ-JPG בפייתון

שלב 1: התקן Aspose.OCR

התקן את הספרייה מ- PyPI באמצעות פיקודת pip הבאה:

pip install aspose-ocr-python-net 

אתה יכול גם להוריד את החבילה מ- releases.

שלב 2: קרא טקסט JPG עם קוד

import aspose.ocr as ocr

# א instantiated Aspose.OCR API
api = ocr.AsposeOcr()

# הוסף תמונה לערכה המוכרת
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# Recognize the image
result = api.recognize(img)

# Print recognition result
print(result[0].recognition_text)

דגם תמונה

קראו טקסט JPG עם Aspose.OCR לפייתון.

קרא טקסט JPG עם Aspose.OCR עבור Python.

Output

Lorem ipsum dolor sit amet,consectetuer adipiscing elit,
sed diam nonummy nibh euismod tincidunt ut laoreet
dolore magna aliguam erat volutpat.Ut wisi enim ad
minim veniam,quis nostrud exerci tation ullamcorper sus-
cipit lobortis nisl ut aliquip ex ea commodo consequat.
Duis autem vel eum iriure dolor in hendrerit in vulputate
velit esse molestie consequat,vel illum dolore eu feugiat
nulla facilisis at vero eros et accumsan et iusto odio

מ JPG טקסט ל-Word באמצעות פייתון

אתה יכול להמיר טקסט JPG ישירות למסמך Microsoft Word שניתן לעריכה על ידי ביצוע הצעדים שהוזכרו קודם. עם זאת, אתה רק צריך לשמור את הטקסט המופק לקובץ .docx באמצעות Python:

import aspose.ocr as ocr

# Instantiate Aspose.OCR API
api = ocr.AsposeOcr()

# הוסף תמונה לקבוצת ההכרה
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# Recognize the image
result = api.recognize(img)

# Print recognition result
print(result[0].recognition_text)

# Save as DOCX
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX, ocr.PdfOptimizationMode.NONE)
Convert JPG Text to Word using Python.

להמיר טקסט מ-JPG ל-WORD באמצעות פייתון.

נסה את Aspose.OCR היום

בקרו בעמוד ה Temporary License שלנו כדי להשיג במהירות רישיון חינם ולפתוח גישה מלאה לספריית Aspose.OCR של Python.

טקסט JPG עם Aspose.OCR – משאבים חינמיים

בנוסף לקריאת טקסט JPG והפקתו, חקור את המשאבים למטה. גלה עוד על תכונות והיכולות של הספרייה.

מסקנה

הוצאה של טקסט מ-JPG היא פשוטה ויעילה עם Aspose.OCR עבור Python. היא מספקת API נקי לזיהוי והמרה של טקסט מקבצי תמונה. ניתן לשלב אותה בקלות במערכות הקיימות שלך לצורכי אוטומציה, חיפוש ועריכה. אם יש לך שאלות, אל תהסס לפנות אלינו ב-free support forum.

ראה גם