Les images contiennent souvent du texte précieux, mais en extraire à partir de formats comme JPG n’est pas une tâche simple. Dans ce post, vous apprendrez comment extraire le texte JPG en utilisant Python. Peu importe si vous automatisez le traitement de documents ou numérisez du matériel imprimé, cette solution vous offre des résultats rapides et précis.
What Is JPG Text?
Le texte JPG est tout texte visible intégré dans un fichier image .jpg
ou .jpeg
. Il peut se présenter sous la forme de :
- Documents numérisés
- Captures d’écran depuis un bureau ou un mobile
- Photographies de panneaux, d’étiquettes ou de reçus
- Cartes de visite et formulaires manuscrits
Depuis que le texte dans un JPG est stocké sous forme de pixels, il doit être converti en texte lisible par machine à l’aide de la reconnaissance optique de caractères (OCR).L’extraction de texte à partir d’images JPG est utile pour diverses raisons. Cela aide à numériser des documents papier, à automatiser la saisie de données à partir de formulaires et à rendre le contenu des images recherchable. Vous pouvez également utiliser le texte extrait dans un code pour une analyse plus approfondie. Avec la technologie OCR, vous gagnez du temps et réduisez le besoin de travail manuel dans toute tâche impliquant des informations basées sur des images.
Aspose.OCR : Extracteur de texte JPG
La OCR (Reconnaissance Optique de Caractères) est le seul moyen fiable d’extraire du texte à partir d’une image JPG. Dans cet article de blog, nous allons utiliser Aspose.OCR for Python pour extraire du texte JPG. C’est une bibliothèque autonome conçue pour les développeurs, offrant les avantages clés suivants :
- Prétraitement intégré (deskew, binarisation, filtrage de bruit)
- Reconnaissance à grande vitesse et haute précision
- Support pour plusieurs formats de sortie : texte brut, JSON, PDF
- Disponible pour Python, Java, .NET et C++.
Aspose.OCR détecte automatiquement les polices, les tailles et même le texte incliné, ce qui le rend idéal tant pour les cas d’utilisation simples qu’avancés. Il scanne les images JPG à la recherche de texte tapé ou manuscrit, détecte les zones de texte dans des mises en page complexes et extrait du contenu multilingue à partir d’images.
Comment extraire du texte JPG en Python
Étape 1 : Installer Aspose.OCR
Installez la bibliothèque depuis PyPI en utilisant la commande pip suivante :
pip install aspose-ocr-python-net
Vous pouvez également télécharger le package depuis les releases.
Étape 2 : Lire le texte JPG avec du code
import aspose.ocr as ocr
# Instancier l'API Aspose.OCR
api = ocr.AsposeOcr()
# Ajouter une image au lot de reconnaissance
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")
# Reconnaître l'image
result = api.recognize(img)
# Print recognition result
print(result[0].recognition_text)
Image d’échantillon

Lire le texte JPG avec Aspose.OCR for Python.
Sortie
Lorem ipsum dolor sit amet,consectetuer adipiscing elit,
sed diam nonummy nibh euismod tincidunt ut laoreet
dolore magna aliguam erat volutpat.Ut wisi enim ad
minim veniam,quis nostrud exerci tation ullamcorper sus-
cipit lobortis nisl ut aliquip ex ea commodo consequat.
Duis autem vel eum iriure dolor in hendrerit in vulputate
velit esse molestie consequat,vel illum dolore eu feugiat
nulla facilisis at vero eros et accumsan et iusto odio
Convertir le texte JPG en Word à l’aide de Python
Vous pouvez convertir le texte JPG directement en un document Microsoft Word modifiable en suivant les étapes mentionnées précédemment. Cependant, vous devez simplement enregistrer le texte extrait dans un fichier .docx
en utilisant Python :
import aspose.ocr as ocr
# Instancier l'API Aspose.OCR
api = ocr.AsposeOcr()
# Ajouter une image au lot de reconnaissance
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")
# Recognize the image
result = api.recognize(img)
# Print recognition result
print(result[0].recognition_text)
# Save as DOCX
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX, ocr.PdfOptimizationMode.NONE)

Convertir le texte JPG en Word en utilisant Python.
Essayez Aspose.OCR aujourd’hui
Visitez notre Temporary License page pour obtenir rapidement une licence gratuite et débloquer l’accès complet à la bibliothèque Aspose.OCR for Python.
JPG Text avec Aspose.OCR – Ressources gratuites
En plus de la lecture et de l’extraction de texte JPG, explorez les ressources ci-dessous. Découvrez-en davantage sur les fonctionnalités et les capacités de la bibliothèque.
Conclusion
L’extraction de texte JPG est simple et efficace avec Aspose.OCR for Python. Il fournit une API claire pour reconnaître et convertir du texte à partir de fichiers image. Vous pouvez facilement l’intégrer dans vos systèmes existants pour l’automatisation, la recherche et l’édition. Si vous avez des questions, n’hésitez pas à nous contacter sur notre forum de support gratuit.