Зображення часто містять цінний текст, але витягти його з форматів, таких як JPG, не є простим завданням. У цьому дописі ви дізнаєтеся, як витягти текст з JPG за допомогою Python. Не має значення, чи автоматизуєте ви обробку документів, чи цифровите друковані матеріали, це рішення надає вам швидкі та точні результати.
Що таке JPG текст?
Текст JPG - це будь-який видимий текст, вбудований в файл зображення .jpg
або .jpeg
. Він може мати форму:
- Скановані документи
- Скріншоти з робочого столу або мобільного пристрою
- Фотографії знаків, етикеток або квитанцій
- Візитки та письмові форми
Оскільки текст у JPG зберігається як пікселі, його потрібно перетворити на машинозчитуваний текст за допомогою OCR (Оптичне розпізнавання символів).Витягування тексту з зображень JPG корисне з різних причин. Це допомагає цифровізувати паперові документи, автоматизувати введення даних з форм і робити контент зображень доступним для пошуку. Ви також можете використовувати витягнутий текст у коді для подальшого аналізу. Завдяки технології OCR ви економите час і зменшуєте потребу в ручній праці в будь-якому завданні, яке містить інформацію на основі зображень.
Aspose.OCR: JPG Текстовий екстрактор
OCR (Оптичне розпізнавання символів) є єдиним надійним способом вилучення тексту з зображення JPG. У цьому блозі ми будемо використовувати Aspose.OCR for Python, щоб витягнути текст з JPG. Це самостійна бібліотека, розроблена для розробників, яка пропонує такі ключові переваги:
- Вбудоване попереднє оброблення (виправлення нахилу, бінаризація, фільтрація шуму)
- Високошвидкісне, високоточне розпізнавання
- Підтримка декількох форматів виводу: простий текст, JSON, PDF
- Доступно для Python, Java, .NET та C++
Aspose.OCR автоматично визначає шрифти, розміри та навіть обернутий текст, що робить його ідеальним як для простих, так і для складних випадків використання. Він сканує JPG-зображення на наявність надрукованого або рукописного тексту, визначає текстові області в складних макетах і витягує багатомовний контент з зображень.
Як витягти текст з JPG в Python
Крок 1: Встановіть Aspose.OCR
Встановіть бібліотеку з PyPI за допомогою наступної команди pip:
pip install aspose-ocr-python-net
Ви також можете завантажити пакет з releases.
Крок 2: Прочитайте текст JPG з кодом
import aspose.ocr as ocr
# Інстанціювати API Aspose.OCR
api = ocr.AsposeOcr()
# Додайте зображення до партії розпізнавання
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")
# Recognize the image
result = api.recognize(img)
# Print recognition result
print(result[0].recognition_text)
Приклад зображення

Читання тексту з JPG за допомогою Aspose.OCR for Python.
Вихід
Lorem ipsum dolor sit amet,consectetuer adipiscing elit,
sed diam nonummy nibh euismod tincidunt ut laoreet
dolore magna aliguam erat volutpat.Ut wisi enim ad
minim veniam,quis nostrud exerci tation ullamcorper sus-
cipit lobortis nisl ut aliquip ex ea commodo consequat.
Duis autem vel eum iriure dolor in hendrerit in vulputate
velit esse molestie consequat,vel illum dolore eu feugiat
nulla facilisis at vero eros et accumsan et iusto odio
Перетворення тексту з JPG у Word за допомогою Python
Ви можете перетворити текст JPG безпосередньо в редагований документ Microsoft Word, дотримуючись раніше згаданих кроків. Однак вам просто потрібно зберегти витягнутий текст у файл .docx
, використовуючи Python:
import aspose.ocr as ocr
# Інстанціюйте API Aspose.OCR
api = ocr.AsposeOcr()
# Додати зображення до партії розпізнавання
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")
# Recognize the image
result = api.recognize(img)
# Print recognition result
print(result[0].recognition_text)
# Save as DOCX
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX, ocr.PdfOptimizationMode.NONE)

Convert JPG Text to Word Using Python.
Спробуйте Aspose.OCR сьогодні
Відвідайте нашу Temporary License сторінку, щоб швидко отримати безкоштовну ліцензію та розблокувати повний доступ до бібліотеки Aspose.OCR for Python.
JPG Текст з Aspose.OCR – Безкоштовні ресурси
На додаток до читання та вилучення тексту з JPG, досліджуйте ресурси нижче. Дізнайтеся більше про функції та можливості бібліотеки.
Висновок
Витягування тексту з JPG є простим та ефективним за допомогою Aspose.OCR for Python. Це забезпечує чистий API для розпізнавання та конвертації тексту з зображень. Ви можете легко інтегрувати його у ваші існуючі системи для автоматизації, пошуку та редагування. Якщо у вас є будь-які питання, не соромтеся звертатися до нас на нашому free support forum.