Le immagini contengono spesso testo prezioso, ma estrarlo da formati come JPG non è un compito semplice. In questo post, imparerai come estrarre testo JPG utilizzando Python. Non importa se stai automatizzando l’elaborazione dei documenti o digitalizzando materiale stampato, questa soluzione ti offre risultati rapidi e accurati.
What Is JPG Text?
Il testo JPG è qualsiasi testo visibile incorporato in un file immagine .jpg
o .jpeg
. Può essere sotto forma di:
- Documenti scansionati
- Screenshots da desktop o mobile
- Fotografie di segnali, etichette o ricevute
- Biglietti da visita e moduli scritti a mano
Poiché il testo in un JPG è memorizzato come pixel, deve essere convertito in testo leggibile dalla macchina utilizzando OCR (Riconoscimento Ottico dei Caratteri).Estrarre testo da immagini JPG è utile per vari motivi. Aiuta a digitalizzare documenti cartacei, automatizzare l’inserimento dati da moduli e rendere il contenuto dell’immagine ricercabile. Puoi anche utilizzare il testo estratto in un codice per ulteriori analisi. Con la tecnologia OCR, risparmi tempo e riduci la necessità di lavoro manuale in qualsiasi compito che coinvolga informazioni basate su immagini.
Aspose.OCR: Estrattore di Testo JPG
L’OCR (Riconoscimento Ottico dei Caratteri) è l’unico metodo affidabile per estrarre testo da un’immagine JPG. In questo post del blog, utilizzeremo Aspose.OCR for Python per estrarre il testo JPG. È una libreria autonoma progettata per sviluppatori, che offre i seguenti vantaggi chiave:
- Pre-elaborazione integrata (correzione inclinazione, binarizzazione, filtraggio del rumore)
- Riconoscimento ad alta velocità e alta precisione
- Supporto per più formati di output: testo semplice, JSON, PDF
- Disponibile per Python, Java, .NET e C++
Aspose.OCR rileva automaticamente i caratteri, le dimensioni e persino il testo ruotato, rendendolo ideale sia per casi d’uso semplici che avanzati. Scansiona immagini JPG per testo digitato o scritto a mano, rileva aree di testo in layout complessi ed estrae contenuti multilingue dalle immagini.
How to Extract JPG Text in Python
Passo 1: Installa Aspose.OCR
Installare la libreria da PyPI utilizzando il seguente comando pip:
pip install aspose-ocr-python-net
Puoi anche scaricare il pacchetto dalle releases.
Step 2: Leggi il testo JPG con codice
import aspose.ocr as ocr
# Istanziate l'API Aspose.OCR
api = ocr.AsposeOcr()
# Aggiungi immagine al lotto di riconoscimento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")
# Recognize the image
result = api.recognize(img)
# Print recognition result
print(result[0].recognition_text)
Immagine di esempio

Leggi il testo JPG con Aspose.OCR for Python.
Output
Lorem ipsum dolor sit amet,consectetuer adipiscing elit,
sed diam nonummy nibh euismod tincidunt ut laoreet
dolore magna aliguam erat volutpat.Ut wisi enim ad
minim veniam,quis nostrud exerci tation ullamcorper sus-
cipit lobortis nisl ut aliquip ex ea commodo consequat.
Duis autem vel eum iriure dolor in hendrerit in vulputate
velit esse molestie consequat,vel illum dolore eu feugiat
nulla facilisis at vero eros et accumsan et iusto odio
Convertire il testo JPG in Word utilizzando Python
Puoi convertire il testo JPG direttamente in un documento Microsoft Word modificabile seguendo i passaggi menzionati in precedenza. Tuttavia, devi solo salvare il testo estratto in un file .docx
utilizzando Python:
import aspose.ocr as ocr
# Instanziare l'API Aspose.OCR
api = ocr.AsposeOcr()
# Aggiungi immagine al lotto di riconoscimento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")
# Recognize the image
result = api.recognize(img)
# Print recognition result
print(result[0].recognition_text)
# Save as DOCX
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX, ocr.PdfOptimizationMode.NONE)

Convertire il testo JPG in Word utilizzando Python.
Prova Aspose.OCR Oggi
Visita la nostra Temporary License pagina per ottenere rapidamente una licenza gratuita e sbloccare l’accesso completo alla libreria Aspose.OCR Python.
Testo JPG con Aspose.OCR – Risorse gratuite
In aggiunta alla lettura e all’estrazione del testo JPG, esplora le risorse qui sotto. Scopri di più sulle funzionalità e le capacità della libreria.
Conclusione
L’estrazione del testo JPG è semplice ed efficace con Aspose.OCR for Python. Fornisce un’API pulita per riconoscere e convertire il testo da file immagine. Puoi facilmente integrarlo nei tuoi sistemi esistenti per automazione, ricerca e modifica. Se hai domande, non esitare a contattarci nel nostro free support forum.