Obrázky často obsahují cenný text, ale extrakce z formátů jako JPG není jednoduchý úkol. V tomto příspěvku se naučíte, jak extrahovat text z JPG pomocí Pythonu. Nezáleží na tom, zda automatizujete zpracování dokumentů nebo digitalizujete tištěný materiál, toto řešení vám poskytne rychlé a přesné výsledky.

Co je JPG text?

JPG text je jakýkoliv viditelný text vložený do souboru s obrázkem .jpg nebo .jpeg. Může mít podobu:

  • Naskenované dokumenty
  • Snímky obrazovky z desktopu nebo mobilu
  • Fotografie značek, štítků nebo účtenek
  • Vizitky a ručně psané formuláře

Jelikož je text v JPG uložen jako pixely, musí být převeden na text čitelný pro stroj pomocí OCR (Optické rozpoznávání znaků).Extrakce textu z JPG obrázků je užitečná z různých důvodů. Pomáhá digitalizovat papírové dokumenty, automatizovat zadávání dat z formulářů a zpřístupnit obsah obrázků pro vyhledávání. Můžete také použít extrahovaný text v kódu pro další analýzu. S technologií OCR šetříte čas a snižujete potřebu manuální práce v jakémkoli úkolu, který zahrnuje informace založené na obrázcích.

Aspose.OCR: JPG Text Extractor

OCR (Optické rozpoznávání znaků) je jediný spolehlivý způsob, jak extrahovat text z JPG obrázku. V tomto blogovém příspěvku použijeme Aspose.OCR for Python k extrakci textu z JPG. Je to samostatná knihovna navržená pro vývojáře, která nabízí následující hlavní výhody:

  • Vestavěné předzpracování (deskew, binarizace, filtrování šumu)
  • Vysokorychlostní, vysoce přesné rozpoznávání
  • Podpora pro více výstupních formátů: obyčejný text, JSON, PDF
  • Dostupné pro Python, Java, .NET a C++

Aspose.OCR automaticky detekuje písma, velikosti a dokonce i rotační text, což jej činí ideálním pro jednoduché i pokročilé případy použití. Prohledává JPG obrázky na psaný nebo ručně psaný text, detekuje textové oblasti v složitých rozvrženích a extrahuje vícejazyčný obsah z obrázků.

How to Extract JPG Text in Python

Krok 1: Nainstalujte Aspose.OCR

Nainstalujte knihovnu z PyPI pomocí následujícího příkazu pip:

pip install aspose-ocr-python-net 

Můžete si také stáhnout balíček z releases.

Krok 2: Číst text z JPG pomocí kódu

import aspose.ocr as ocr

# Instancujte API Aspose.OCR
api = ocr.AsposeOcr()

# Přidat obrázek do rozpoznávací várky
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# Recognize the image
result = api.recognize(img)

# Print recognition result
print(result[0].recognition_text)

Ukázkový obrázek

Přečtěte si text z JPG pomocí Aspose.OCR for Python.

Přečtěte si text z JPG pomocí Aspose.OCR for Python.

Výstup

Lorem ipsum dolor sit amet,consectetuer adipiscing elit,
sed diam nonummy nibh euismod tincidunt ut laoreet
dolore magna aliguam erat volutpat.Ut wisi enim ad
minim veniam,quis nostrud exerci tation ullamcorper sus-
cipit lobortis nisl ut aliquip ex ea commodo consequat.
Duis autem vel eum iriure dolor in hendrerit in vulputate
velit esse molestie consequat,vel illum dolore eu feugiat
nulla facilisis at vero eros et accumsan et iusto odio

Převod textu z JPG na Word pomocí Pythonu

Můžete převést text z JPG přímo do editelného dokumentu Microsoft Word tím, že budete následovat výše uvedené kroky. Nicméně, stačí uložit extrahovaný text do souboru .docx pomocí Pythonu:

import aspose.ocr as ocr

# Instancujte API Aspose.OCR
api = ocr.AsposeOcr()

# Přidat obrázek do dávky rozpoznávání
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# Recognize the image
result = api.recognize(img)

# Print recognition result
print(result[0].recognition_text)

# Save as DOCX
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX, ocr.PdfOptimizationMode.NONE)
Convert JPG Text to Word using Python.

Convert JPG Text to Word Using Python.

Vyzkoušejte Aspose.OCR dnes

Navštivte naši Temporary License stránku a rychle získejte bezplatnou licenci a odemkněte plný přístup k knihovně Aspose.OCR Python.

JPG Text s Aspose.OCR – Bezplatné zdroje

Kromě čtení a extrakce textu z JPG prozkoumejte níže uvedené zdroje. Objevte více o funkcích a možnostech knihovny.

Závěr

Extrakce textu z JPG je jednoduchá a efektivní s Aspose.OCR for Python. Poskytuje čisté API pro rozpoznávání a převod textu z obrazových souborů. Můžete jej snadno integrovat do svých stávajících systémů pro automatizaci, vyhledávání a úpravy. Pokud máte jakékoli dotazy, neváhejte nás kontaktovat na našem free support forum.

See Also