Bilder innehåller ofta värdefull text, men att extrahera den från format som JPG är inte en enkel uppgift. I detta inlägg kommer du att lära dig hur man extraherar JPG-text med Python. Oavsett om du automatiserar dokumentbearbetning eller digitaliserar tryckt material, ger denna lösning snabba och exakta resultat.
What Is JPG Text?
JPG-text är all synlig text som är inbäddad i en .jpg
eller .jpeg
bildfil. Det kan vara i form av:
- Scannade dokument
- Screenshots från skrivbord eller mobil
- Fotografier av skyltar, etiketter eller kvitton
- Visakort och handskrivna formulär
Eftersom texten i en JPG lagras som pixlar måste den konverteras till maskinläsbar text med hjälp av OCR (Optical Character Recognition).Att extrahera text från JPG-bilder är användbart av olika anledningar. Det hjälper till att digitalisera pappersdokument, automatisera datainmatning från formulär och göra bildinnehåll sökbart. Du kan också använda den extraherade texten i en kod för vidare analys. Med OCR-teknologi sparar du tid och minskar behovet av manuellt arbete i alla uppgifter som involverar bildbaserad information.
Aspose.OCR: JPG Text Extractor
OCR (Optical Character Recognition) är det enda pålitliga sättet att extrahera text från en JPG-bild. I det här blogginlägget kommer vi att använda Aspose.OCR för Python för att extrahera JPG-text. Det är ett fristående bibliotek som är utformat för utvecklare och erbjuder följande nyckelfördelar:
- Inbyggd förbehandling (skew-korrigering, binarisation, brusfiltrering)
- Hög hastighet, hög noggrannhet igenkänning
- Support för flera utmatningsformat: ren text, JSON, PDF
- Tillgänglig för Python, Java, .NET och C++
Aspose.OCR upptäcker automatiskt teckensnitt, storlekar och till och med roterad text, vilket gör det idealiskt för både enkla och avancerade användningsfall. Den skannar JPG-bilder efter typad eller handskrift, upptäcker textområden i komplexa layouter och extraherar flerspråkigt innehåll från bilder.
Hur man extraherar JPG-text i Python
Steg 1: Installera Aspose.OCR
Install the library from PyPI using the following pip command:
pip install aspose-ocr-python-net
Du kan också ladda ner paketet från releases.
Steg 2: Läs JPG-text med kod
import aspose.ocr as ocr
# Instansiera Aspose.OCR API
api = ocr.AsposeOcr()
# Lägg till bild i igenkänningsbatchen
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")
# Recognize the image
result = api.recognize(img)
# Print recognition result
print(result[0].recognition_text)
Exempelbild

Läs JPG-text med Aspose.OCR för Python.
Output
Lorem ipsum dolor sit amet,consectetuer adipiscing elit,
sed diam nonummy nibh euismod tincidunt ut laoreet
dolore magna aliguam erat volutpat.Ut wisi enim ad
minim veniam,quis nostrud exerci tation ullamcorper sus-
cipit lobortis nisl ut aliquip ex ea commodo consequat.
Duis autem vel eum iriure dolor in hendrerit in vulputate
velit esse molestie consequat,vel illum dolore eu feugiat
nulla facilisis at vero eros et accumsan et iusto odio
Konvertera JPG-text till Word med Python
Du kan konvertera JPG-text direkt till ett redigerbart Microsoft Word-dokument genom att följa stegen som nämnts tidigare. Men du behöver bara spara den extraherade texten till en .docx
-fil med hjälp av Python:
import aspose.ocr as ocr
# Instansiera Aspose.OCR API
api = ocr.AsposeOcr()
# Lägg till bild i igenkänningsbatchen
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")
# Recognize the image
result = api.recognize(img)
# Print recognition result
print(result[0].recognition_text)
# Save as DOCX
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX, ocr.PdfOptimizationMode.NONE)

Konvertera JPG-text till Word med Python.
Prova Aspose.OCR idag
Besök vår Temporary License sida för att snabbt få en gratis licens och låsa upp fullständig åtkomst till Aspose.OCR Python-biblioteket.
JPG Text med Aspose.OCR – Fria resurser
Förutom att läsa och extrahera JPG-text, utforska resurserna nedan. Upptäck mer om bibliotekets funktioner och möjligheter.
Slutsats
Att extrahera text från JPG är enkelt och effektivt med Aspose.OCR för Python. Det erbjuder ett rent API för att känna igen och konvertera text från bildfiler. Du kan enkelt integrera det i dina befintliga system för automatisering, sökning och redigering. Om du har några frågor, tveka inte att kontakta oss på vårt free support forum.