Imagens frequentemente contêm texto valioso, mas extrair isso de formatos como JPG não é uma tarefa simples. Neste post, você aprenderá como extrair texto JPG usando Python. Não importa se você está automatizando o processamento de documentos ou digitalizando material impresso, essa solução lhe dá resultados rápidos e precisos.

O que é texto JPG?

O texto JPG é qualquer texto visível incorporado em um arquivo de imagem .jpg ou .jpeg. Pode estar na forma de:

  • Documentos escaneados
  • Capturas de tela de desktop ou mobile
  • Fotografias de sinais, etiquetas ou recibos
  • Cartões de visita e formulários manuscritos

Desde que o texto em um JPG é armazenado como pixels, ele deve ser convertido em texto legível por máquina usando OCR (Reconhecimento Óptico de Caracteres).Extrair texto de imagens JPG é útil por várias razões. Ajuda a digitalizar documentos em papel, automatizar a entrada de dados de formulários e tornar o conteúdo da imagem pesquisável. Você também pode usar o texto extraído em um código para análise adicional. Com a tecnologia OCR, você economiza tempo e reduz a necessidade de trabalho manual em qualquer tarefa que envolva informações baseadas em imagem.

Aspose.OCR: Extrator de Texto JPG

OCR (Reconhecimento Óptico de Caracteres) é a única maneira confiável de extrair texto de uma imagem JPG. Neste post do blog, usaremos Aspose.OCR for Python para extrair texto JPG. É uma biblioteca independente projetada para desenvolvedores, oferecendo os seguintes benefícios principais:

  • Pré-processamento integrado (correção de inclinação, binarização, filtragem de ruído)
  • Reconhecimento de alta velocidade e alta precisão
  • Suporte para vários formatos de saída: texto simples, JSON, PDF
  • Disponível para Python, Java, .NET e C++

Aspose.OCR detecta automaticamente fontes, tamanhos e até mesmo texto rotacionado, tornando-o ideal para casos de uso simples e avançados. Ele escaneia imagens JPG em busca de texto digitado ou escrito à mão, detecta áreas de texto em layouts complexos e extrai conteúdo multilíngue de imagens.

Como Extrair Texto de JPG em Python

Passo 1: Instale o Aspose.OCR

Instale a biblioteca do PyPI usando o seguinte comando pip:

pip install aspose-ocr-python-net 

Você também pode baixar o pacote a partir dos releases.

Passo 2: Ler texto JPG com código

import aspose.ocr as ocr

# Instanciar a API Aspose.OCR
api = ocr.AsposeOcr()

# Adicionar imagem ao lote de reconhecimento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# Recognize the image
result = api.recognize(img)

# Print recognition result
print(result[0].recognition_text)

Imagem de Exemplo

Leia texto JPG com Aspose.OCR for Python.

Leia texto JPG com Aspose.OCR for Python.

Output

Lorem ipsum dolor sit amet,consectetuer adipiscing elit,
sed diam nonummy nibh euismod tincidunt ut laoreet
dolore magna aliguam erat volutpat.Ut wisi enim ad
minim veniam,quis nostrud exerci tation ullamcorper sus-
cipit lobortis nisl ut aliquip ex ea commodo consequat.
Duis autem vel eum iriure dolor in hendrerit in vulputate
velit esse molestie consequat,vel illum dolore eu feugiat
nulla facilisis at vero eros et accumsan et iusto odio

Converter texto JPG para Word usando Python

Você pode converter texto JPG diretamente em um documento Microsoft Word editável seguindo os passos mencionados anteriormente. No entanto, você só precisa salvar o texto extraído em um arquivo .docx usando Python:

import aspose.ocr as ocr

# Instanciar a API Aspose.OCR
api = ocr.AsposeOcr()

# Adicionar imagem ao lote de reconhecimento
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# Recognize the image
result = api.recognize(img)

# Print recognition result
print(result[0].recognition_text)

# Save as DOCX
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX, ocr.PdfOptimizationMode.NONE)
Converter texto JPG para Word usando Python.

Converter texto JPG para Word usando Python.

Experimente o Aspose.OCR hoje.

Visite nossa Temporary License página para obter rapidamente uma licença gratuita e desbloquear o acesso completo à biblioteca Aspose.OCR Python.

Texto JPG com Aspose.OCR – Recursos Gratuitos

Além de ler e extrair texto de JPG, explore os recursos abaixo. Descubra mais sobre os recursos e capacidades da biblioteca.

Conclusão

Extrair texto de JPG é simples e eficaz com Aspose.OCR for Python. Ele oferece uma API limpa para reconhecer e converter texto de arquivos de imagem. Você pode integrá-lo facilmente em seus sistemas existentes para automação, pesquisa e edição. Se você tiver alguma dúvida, sinta-se à vontade para entrar em contato conosco em nosso free support forum.

Veja também