13 Mei 2015

Menyalin Teks dari File JPG, PNG, GIF atau PDF dengan Google Drive

Ada kalanya ketika mencari referensi untuk keperluan tertentu (bikin makalah, skripsi, tesis, dsb.), kita menemukan dokumen dengan format yang kurang bersahabat. Misalnya saja dokumen hasil scan berformat JPG, PNG atau GIF, yang tentu saja teksnya tidak bisa (langsung) disalin. Bisa juga kita ketemu dengan file PDF, yang ternyata diproteksi, tak bisa dikopas isinya.

Menyalin Teks dari File JPG, PNG, GIF atau PDF dengan Google Drive

Solusi umumnya, kita bisa mengetik ulang teks-teks yang diperlukan sebagai bahan tulisan kita. Untuk beberapa kalimat, mengetik ulang rasanya bukanlah masalah, namun bila kita wajib menyalin seluruh teks dari dokumen-dokumen yang tidak bisa di-copy paste tadi (berlembar-lembar teks, beratus-ratus paragraf), bisa keriting ini jari sob :D

Adakah solusi yang lebih baik dari mengetik ulang? Tentu saja ada. Pernah mendengar atau membaca tentang OCR? Apa itu OCR? OCR adalah singkatan dari Optical Character Recognition. Singkatnya, kita bisa memanfaatkan teknologi OCR untuk mengkonversi teks yang tertera pada gambar atau foto (juga PDF) menjadi teks yang bisa disalin tempel dan diedit.

Di mana dan bagaimana kita bisa menggunakan teknologi OCR? Seperti yang tercantum di judul, kita bisa menggunakan teknologi OCR yang telah lama tertanam di Google Drive. Telah lama? Iya sob, sudah cukup lama teknologi OCR ini ada di Google Drive, tapi belum lama ini, Google telah meng-upgrade Google Drive dengan teknologi OCR terbaru yang sanggup menangani lebih dari 200 bahasa, termasuk bahasa Indonesia, Aceh, Sunda, Jawa, Madura, Bali, Batak, Gayo, dan Minangkabau.

Nah, bila Anda sedang meneliti bahasa misalnya, lalu menemukan literatur dalam bahasa daerah atau bahasa asing yang kurang Anda mengerti dan kebetulan tidak bisa diedit langsung (hasil scan), teknologi OCR dari Google Drive ini tentu sangat membantu dan bisa diandalkan.

Lalu bagaimana cara menyalin teks dari gambar, foto dengan format JPG, PNG, GIF, atau dokumen PDF yang tidak bisa dikopas? Lanjut bacanya sob.

Pertama, siapkan file gambar, foto, atau PDF yang mengandung teks (bisa dari hasil scan, kamera, atau nemu di internet). Pastikan teks di dalam file tersebut tidak bisa disalin sob, kalau ternyata bisa, tak perlu pakai OCR segala :D

Selanjutnya, upload file tersebut ke Google Drive. Dalam tutorial ini saya mengunggah file PNG hasil scan yang terdiri dari beberapa paragraf dalam bahasa Jawa.

Unggah file ke Google Drive


Klik kanan file hasil unggahan di Google Drive tersebut, lalu pilih Open with > Google Docs.



Tunggu beberapa saat, lalu sebuah dokumen baru akan terbuka di Google Docs. Nah, di dokumen tersebut kita bisa memperoleh teks hasil konversi dari file gambar PNG tadi.



Mudah sekali bukan? Bukaaan :D

Belum selesai sob, silakan teliti terlebih dahulu teks hasil konversi tersebut, karena kemungkinan besar terdapat beberapa kesalahan yang harus dikoreksi.

Sip, setelah itu kita bisa mengedit teks sesuai keperluan di Google Docs (atau bisa disalin tempel ke aplikasi lain, Office Word misalnya).

Sebagai tambahan, tidak semua file (terutama gambar atau foto) bisa dikonversi teksnya dengan teknologi OCR dari Google Drive ini. Untuk mendapatkan hasil terbaik, file yang Anda unggah wajib memenuhi beberapa syarat berikut ini.

  • Gunakan file gambar atau foto yang berkualitas baik (dengan resolusi tinggi), file dengan resolusi rendah biasanya tidak terbaca oleh teknologi OCR.
  • Jangan menggunakan gambar atau foto dengan teks yang miring. Edit terlebih dahulu file Anda sebelum diunggah di Google Drive untuk keperluan OCR.
  • File gambar atau PDF di atas 2MB tidak bisa dikonversi secara keseluruhan (ada bagian yang tidak dikonversi). Jadi pastikan file yang Anda unggah tidak lebih dari 2MB. Jika terpaksa lebih dari 2MB, bagi file tersebut menjadi beberapa bagian sebelum diunggah.

Ok, selamat mencoba :)

Memudahkan

Suka dengan artikel Memudahkan?

Dukung kami dengan memasukkan blog ini pada whitelist ad blocker Anda.

Terima kasih :)

×