Gambar sering mengandung teks yang berharga, tetapi mengekstraknya dari format seperti JPG bukanlah tugas yang sederhana. Dalam pos ini, Anda akan belajar cara mengekstrak teks JPG menggunakan Python. Tidak masalah jika Anda sedang mengotomatisasi pemrosesan dokumen atau mendigitalkan materi cetak, solusi ini memberi Anda hasil yang cepat dan akurat.

What Is JPG Text?

Teks JPG adalah teks yang terlihat yang disematkan dalam file gambar .jpg atau .jpeg. Ini bisa berupa:

  • Dokumen yang dipindai
  • Tangkapan layar dari desktop atau mobile
  • Foto tanda, label, atau kwitansi
  • Kartu nama dan formulir tulisan tangan

Karena teks dalam JPG disimpan sebagai piksel, itu harus dikonversi menjadi teks yang dapat dibaca mesin menggunakan OCR (Pengenalan Karakter Optik).Mengekstrak teks dari gambar JPG berguna untuk berbagai alasan. Ini membantu mendigitalkan dokumen kertas, mengotomatiskan entri data dari formulir, dan membuat konten gambar dapat dicari. Anda juga dapat menggunakan teks yang diekstrak dalam kode untuk analisis lebih lanjut. Dengan teknologi OCR, Anda menghemat waktu dan mengurangi kebutuhan untuk pekerjaan manual dalam tugas apa pun yang melibatkan informasi berbasis gambar.

Aspose.OCR: Pengambil Teks JPG

OCR (Pengakuan Karakter Optik) adalah satu-satunya cara yang dapat diandalkan untuk mengekstrak teks dari gambar JPG. Dalam posting blog ini, kita akan menggunakan Aspose.OCR for Python untuk mengekstrak teks JPG. Ini adalah perpustakaan mandiri yang dirancang untuk pengembang, menawarkan manfaat kunci berikut:

  • Pemrosesan awal bawaan (perataan, binarisasi, penyaringan kebisingan)
  • Pengakuan berkecepatan tinggi dan akurasi tinggi
  • Dukungan untuk berbagai format output: teks biasa, JSON, PDF
  • Tersedia untuk Python, Java, .NET, dan C++

Aspose.OCR secara otomatis mendeteksi font, ukuran, dan bahkan teks yang diputar, menjadikannya ideal untuk kasus penggunaan sederhana maupun lanjutan. Ini memindai gambar JPG untuk teks yang diketik atau ditulis tangan, mendeteksi area teks dalam tata letak kompleks, dan mengekstrak konten multibahasa dari gambar.

Bagaimana Cara Mengekstrak Teks JPG di Python

Langkah 1: Instal Aspose.OCR

Instal perpustakaan dari PyPI menggunakan perintah pip berikut:

pip install aspose-ocr-python-net 

Anda juga dapat mengunduh paket dari releases.

Langkah 2: Bacalah Teks JPG dengan Kode

import aspose.ocr as ocr

# Instansiasi API Aspose.OCR
api = ocr.AsposeOcr()

# Tambahkan gambar ke dalam batch pengenalan
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# Recognize the image
result = api.recognize(img)

# Print recognition result
print(result[0].recognition_text)

Gambar Contoh

Baca Teks JPG dengan Aspose.OCR for Python.

Baca Teks JPG dengan Aspose.OCR for Python.

Output

Lorem ipsum dolor sit amet,consectetuer adipiscing elit,
sed diam nonummy nibh euismod tincidunt ut laoreet
dolore magna aliguam erat volutpat.Ut wisi enim ad
minim veniam,quis nostrud exerci tation ullamcorper sus-
cipit lobortis nisl ut aliquip ex ea commodo consequat.
Duis autem vel eum iriure dolor in hendrerit in vulputate
velit esse molestie consequat,vel illum dolore eu feugiat
nulla facilisis at vero eros et accumsan et iusto odio

Mengonversi Teks JPG ke Word Menggunakan Python

Anda dapat mengonversi teks JPG langsung menjadi dokumen Microsoft Word yang dapat diedit dengan mengikuti langkah-langkah yang disebutkan sebelumnya. Namun, Anda hanya perlu menyimpan teks yang diekstrak ke dalam file .docx menggunakan Python:

import aspose.ocr as ocr

# Instansikan API Aspose.OCR
api = ocr.AsposeOcr()

# Tambahkan gambar ke dalam batch pengenalan
img = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE)
img.add("sample-with-text.jpg")

# Recognize the image
result = api.recognize(img)

# Print recognition result
print(result[0].recognition_text)

# Simpan sebagai DOCX
result[0].save("ImagetoDOCX.docx", ocr.SaveFormat.DOCX, ocr.PdfOptimizationMode.NONE)
Convert JPG Text to Word menggunakan Python.

Ubah Teks JPG ke Word Menggunakan Python.

Coba Aspose.OCR Hari Ini

Kunjungi halaman Temporary License kami untuk dengan cepat mendapatkan lisensi gratis dan membuka akses penuh ke pustaka Aspose.OCR Python.

JPG Teks dengan Aspose.OCR – Sumber Daya Gratis

Selain membaca dan mengekstrak teks JPG, jelajahi sumber daya di bawah ini. Temukan lebih banyak tentang fitur dan kemampuan perpustakaan tersebut.

Kesimpulan

Ekstraksi teks JPG sederhana dan efektif dengan Aspose.OCR for Python. Ini menyediakan API yang bersih untuk mengenali dan mengonversi teks dari file gambar. Anda dapat dengan mudah mengintegrasikannya ke dalam sistem yang sudah ada untuk otomatisasi, pencarian, dan pengeditan. Jika Anda memiliki pertanyaan, jangan ragu untuk menghubungi kami di forum dukungan gratis kami .

Lihat Juga