Data Extraction From Images in Java

Přehled

Optické rozpoznávání značek (OMR) je elektronický proces, který usnadňuje čtení a zachycování dat, která označili lidé na speciálně navržených dokumentech, jako jsou testy nebo dotazníky, které zahrnují bublinkové nebo čtvercové vstupy vyplněné uživateli. Pomocí extrakce dat z obrázků v Javě můžeme efektivně zpracovávat skenované obrázky těchto dotazníků, anket nebo testových listů, což umožňuje programově číst uživatelské vstupy. Tento článek vás provede tím, jak provádět OMR a extrahovat data z obrázků pomocí Javy.

Následující témata budou v tomto článku pokryta:

  1. Java OMR API pro extrakci dat z obrázku
  2. Extrakcí dat z obrázků v Javě
  3. Provádění OMR a extrakce dat z více obrázků
  4. Extrahujte OMR data s prahovou hodnotou
  5. Extrahujte OMR data s přepočtem

Java OMR API pro extrakci dat z obrázku

Pro provádění OMR operací a extrakci dat z obrázků v Javě použijeme Aspose.OMR pro Java API. Tento mocný nástroj umožňuje navrhování, vytváření a rozpoznávání odpovědních listů, testů, MCQ papírů, kvízů, dotazníkových formulářů, anket a volebních lístků.

Třída OmrEngine v rámci API je odpovědná za vytváření šablon a zpracování obrázků. Její metoda getTemplateProcessor(String templatePath) inicializuje instanci TemplateProcessor přizpůsobenou k zpracování šablon a obrázků. Pro rozpoznání obrázku lze využít metodu recognizeImage(String imagePath), která vrací všechny OMR prvky jako instanci třídy RecognitionResult. Pomocí metody getCsv() můžete generovat řetězec CSV obsahující výsledky rozpoznání. Dále metoda recalculate(RecognitionResult result, int recognitionThreshold) zpřesňuje výsledky rozpoznání pomocí vlastních parametrů.

Prosím, buďte si jisti, že buď stáhnete JAR API, nebo přidáte následující konfiguraci pom.xml do aplikace založené na Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>
<dependency>
     <groupId>com.aspose</groupId>
     <artifactId>aspose-omr</artifactId>
     <version>19.12</version>
</dependency>

Extrakce dat z obrázků v Javě

Pro provedení OMR operace potřebujeme připravený OMR šablonový soubor (.omr) a obrázek uživatelsky vyplněných formulářů nebo listů. Proces extrakce dat z obrázků v Javě, konkrétně pomocí OMR operací, zahrnuje následující kroky:

  1. Nejprve vytvořte instanci třídy OmrEngine.
  2. Dále zavolejte metodu getTemplateProcessor() a inicializujte objekt třídy TemplateProcessor, přičemž jako argument předáte cestu k OMR šablonovému souboru.
  3. Poté získejte objekt RecognitionResult voláním metody recognizeImage() s cestou k obrázku jako argumentem.
  4. Následně získejte výsledky rozpoznání jako CSV řetězce pomocí metody getCsv().
  5. Nakonec uložte CSV výsledek jako CSV soubor na místním disku.

Následující ukázkový kód demonstruje, jak provádět extrakci dat z obrázků v Javě převodem OMR dat do formátu CSV.

Extract-Data-from-an-Image-in-Java

Provádění OMR a extrakce dat z obrázku v Javě.

Prosím stáhněte OMR šablonu použitou v tomto blogovém příspěvku.

Provádění OMR a extrakce dat z více obrázků

Můžeme provádět OMR operace na více obrázcích a extrahovat data do samostatného CSV souboru pro každý z nich, pomocí výše uvedených kroků. Pro úspěšnou extrakci dat z obrázků v Javě je nutné opakovat kroky 3, 4 a 5 pro všechny obrázky jednotlivě.

Níže je ukázkový kód, který demonstruje, jak extrahovat OMR data z více obrázků pomocí Javy.

. Seznam dat, ať už odrážkový nebo číslovaný, musí zůstat zcela nezměněn.

Extrakce OMR dat s prahovou hodnotou v Javě

Pro provádění operací optického rozpoznávání značek (OMR) v Javě používáme prahovou hodnotu mezi 0 a 100 na základě specifických požadavků. Tato prahová hodnota, používaná při extrakci dat z obrázků v Javě, určuje, jak přísné bude API při zvýrazňování odpovědí; vyšší hodnota zvyšuje přísnost. Dodržování výše uvedených kroků je nezbytné pro zpracování OMR s vybranou prahovou hodnotou. Konkrétně v rámci kroku #3 musí být zavolána metoda recognizeImage(string, int32). Tato přetížená metoda vyžaduje cestu k obrázkovému souboru a požadovanou prahovou hodnotu jako své parametry.

Následující ukázkový kód demonstruje jak provádět OMR s prahovou hodnotou pomocí Javy:

Extrakce OMR dat s přepočtem v Javě

Při práci s přesnou extrakcí dat z obrázků v Javě, zejména pokud jde o OMR, může být nutné přepočítat výsledky pomocí různých prahových hodnot. Konfigurací API může být přepočet automatizován pomocí metody TemplateProcessor.recalculate(). Tento přístup umožňuje více iterací zpracování obrázků úpravou prahové hodnoty, dokud není dosaženo požadovaného výsledku. Pro úspěšné provedení OMR operace s přepočtem dodržujte následující kroky:

  1. Nejprve vytvořte instanci třídy OmrEngine.
  2. Dále zavolejte metodu getTemplateProcessor() a inicializujte objekt třídy TemplateProcessor, přičemž jako argument předáte cestu k OMR šablonovému souboru.
  3. Poté získejte objekt RecognitionResult voláním metody recognizeImage() s cestou k obrázku jako argumentem.
  4. Dále exportujte výsledky rozpoznání jako CSV řetězec pomocí metody getCsv().
  5. Poté uložte CSV výsledek jako CSV soubor na místním disku.
  6. Dále zavolejte metodu recalculate(). Ta přijímá objekt RecognitionResult a prahovou hodnotu jako argumenty.
  7. Následně exportujte výsledky rozpoznání jako CSV řetězec pomocí metody getCsv().
  8. Nakonec uložte CSV výsledek jako CSV soubor na místním disku.

Následující ukázkový kód demonstruje jak provádět OMR s metodou přepočtu pomocí Javy:

.

Získejte zdarma licenci

Máte možnost získat zdarma dočasnou licenci pro vyzkoušení knihovny bez omezení hodnocení. To je skvělý způsob, jak prozkoumat funkce, jako je extrakce dat z obrázků v Javě, což vám umožní plně vyhodnotit její schopnosti. Seznam dat níže zůstává beze změn pro vaši referenci:

  1. Knihovna efektivně pracuje s velkým objemem dat.
  2. Integrace s existujícími systémy je bezproblémová.
  3. Extrahovaná data jsou vysoce přesná a spolehlivá.
  4. Kroků instalace je snadný a dobře zdokumentovaný.

Závěr

V tomto článku jsme se naučili, jak:

  • provádět OMR operaci na obrázcích;
  • extrahovat data ve formátu CSV programově;
  • aplikovat nastavení prahové hodnoty při provádění OMR na obrázcích;
  • přepočítávat OMR výsledky v automatizovaném procesu pomocí Javy.

Kromě toho, když pracujete s extrakcí dat z obrázků v Javě, můžete prozkoumat více o API Aspose.OMR pro Java tím, že si prohlédnete dokumentaci. Pokud narazíte na jakékoli problémy, neváhejte nás kontaktovat na našem fóru pro bezplatnou podporu.

Viz také