it-swarm-tr.com

En iyi, en basit OCR çözümü nedir?

Etrafımda bulunduğum, mümkün olan en az güçlükle bir sürü kağıt taramak istiyorum. Bunları Basit Tarama kullanarak görüntülere dönüştürmek, ardından OCR kullanarak bunları metne dönüştürmek istiyorum. Bir düğmeye basıldığında bana iyi sonuçlar verecek bir GUI ile iyi bir OCR uygulaması var mı?

75
Bou
  • GOCRden bir OCR (Optik Karakter Tanıma) programıdır. Taranan görüntüleri dönüştürür metin dosyalarına geri dönün.

  • CLARA başka bir iyi grafiksel seçenektir.

  • OCRADden tek başına bir konsol uygulaması olarak kullanılabilecek bir OCR’dir, veya diğer programlara arka uç olarak.

  • KOOKAden bir KDE uygulamasıdır ancak yüklemeniz gereken ek olarak iyi çalışır GOCR ve OCRAD gibi gerçek OCR programları. Kooka ve OCR programlarını kurduktan sonra, JPEG'i metne dönüştürmek için Kooka'yı OCR kurulum konumuna yönlendirmelisiniz.

  • OCRFeederden , bir belge düzeni analizi ve optik karakter tanıma sistemidir.

  • Tesseractden Komut satırı yardımcı programıdır ve kullanımı çok basittir. Dili yükleyebilirsiniz paket tesseract-ocr-eng from burada .

Şuna bir bakın sayfa .

Not:
Terminali çalıştırmak için tesseract yazın ve aşağıdakileri yazın

tesseract imagefile.tif outputfile.txt

Tesseract yalnızca bir TIFF dosyasını okuyabilir - bir JPEG veya PDF veya her neyse, dönüştürmeniz gerekir. Ayrıca, dosya adı uzantısı .tiff olmamalıdır, aksi halde hataları düzeltmelidir.

70
karthick87

Kullanabileceğiniz birkaç popüler OCR komut satırı aracı var (GUI'leri olup olmadığından emin değilim):

  • Tesseract ( ReadMe , SSS ) (Python)

    Şunlar için de mevcuttur: Tesseract .NET , Tesseract iOS

    1985-1995 yılları arasında HP Laboratuarlarında ve şimdi Google'da geliştirilen bir OCR Motoru. Tesseract muhtemelen en doğru açık kaynaklı OCR motorudur.

    Kullanımı:

    tesseract [inputFile] [outputFile] [-l optionalLanguageFile] [PathTohOCRConfigFile]
    
  • GOCR

    Açık kaynaklı karakter tanıma. Metnin taranmış görüntülerini tekrar metin dosyalarına dönüştürür. GOCR farklı ön uçlarla birlikte kullanılabilir; bu da farklı işletim sistemlerine ve mimarilere bağlantı kurmayı çok kolaylaştırır. Birçok farklı görüntü formatını açabilir ve kalitesi günlük olarak iyileştirilmektedir.

  • OCRopus ™ ( SSS ) (Python, NumPy ve SciPy ile yazılmış)

    Takılabilir düzen analizi, takılabilir karakter tanıma, istatistiksel doğal dil modellemesi ve çok dilli yetenekleri içeren belge analizindeki sorunları ele almak için büyük ölçekli makine öğreniminin kullanılmasına odaklanan OCR sistemi.

    OCRopus motoru iki araştırma projesine dayanıyor: 90'lı yılların ortalarında geliştirilen ve ABD Sayım bürosu tarafından konuşlandırılan yüksek performanslı bir el yazısı tanıyıcı ve yeni yüksek performanslı düzen analizi yöntemleri.

    OCRopus, Google tarafından desteklenmektedir ve başlangıçta yüksek verimli, yüksek hacimli belge dönüştürme çalışmaları için tasarlanmıştır. Diğer birçok uygulama için de mükemmel bir OCR sistemi olacağını umuyoruz.

  • Tessnet2 (Açık kaynak, OCR, Tesseract, .NET, DOTNET, C #, VB.NET, C++/CLI)

    Tesseract bir C++ açık kaynaklı OCR motorudur. Tessnet2, OCR yapmak için çok basit yöntemler sunan .NET Assembly'dir. Tessnet2, Apache 2 lisansı altındadır (tesseract gibi), yani ticari ürünlerde istediğiniz gibi kullanabilirsiniz.

Birkaç kişi: Linux için ABBYY CLI OCR , Asprise OCR

Daha eksiksiz bir liste için şunları kontrol edin: optik karakter tanıma yazılımının listesi Wikipedia'da

Ayrıca bakınız: wanghaisheng/awesome-ocr - Gelecek vaat eden OCR kaynaklarını içeren bir liste GitHub'da.

10
kenorb

Linux akıllı-ocr-çözeltisi

sorumluluk reddi - Bu açık kaynaklı çözümün geliştirilmesine yakından bağlıyım

Lios, tarayıcıyı veya bir kamerayı kullanarak baskıyı metne dönüştürebilir.

Ayrıca taranmış resimlerden Pdf, Resim veya Görüntüler içeren Klasör gibi diğer kaynaklardan da metin üretebilir.

Görme engelliler için programa toplam erişilebilirlik verilmektedir.

Yakından bağlı olduğum için - geribildirim isterim.

9
Nalin.x.Linux

Gscan2PDF

Çok sayfalı OCR PDF veya taranan belgeler

Bu muhtemelen en kolay yoldur. Gscan2pdf, yalnızca dosyaları taramanıza değil, aynı zamanda dosyaları içe aktarmanıza ve üzerinde OCR gerçekleştirmenize de olanak sağlayan grafik bir araçtır. Yükleme buradan gscan2pdfInstall gscan2pdf , Ubuntu Software Center'dan veya bu komutu bir terminalde çalıştırdıktan sonra:

Sudo apt-get install gscan2pdf
  • Gscan2pdf dosyasını çalıştırın
  • Pdf dosyasını içe aktar (Ctrl + O)
  • İsteğe bağlı: Araçlar> Temizle
  • Araçlar> OCR Tasarrufu'nu (Ctrl + S) seçin.

Gscan2PDF özelleştirilebilir OCR motorlarını kullanabilir, varsayılan olarak tesseract-ocr

Uygun dili seçmeyi düşünebilirsiniz. Bu durumda tesseract-ocr-LANG paketini kurmanız gerekecek, burada LANG ISO 639-2 dil kodunun üç harfli olduğu. Şimdi 16.04 deposunda 108 diliniz var.

8
mxdsp

Sadece çok iyi çalıştığı ve kesinlikle listede olması gerektiği için:

gimageReader
Ekran görüntüsü örneği:

enter image description here

Depoda (18.10'da cevaplandı, ancak uzun zamandır kullanıyor)

3
Jacob Vlijm

Az önce (16.04 altında) pdfocr.rb ile başarı elde ettim. Bu listelenir buntu wiki

İşte ppa ancak 16.04 deposu güncellenmedi. Ruby github'daki yukarıdaki komut dosyası yine de 16.04 ile çalışıyor.

Github'dan indirebilirsiniz. Aşağıdaki paketlerin kurulu olması gerekecektir:

Ruby tesseract-ocr pdftk exactimage

sonra pdfocr.rb dosyasını çalıştırılabilir hale getirdi ve çalıştırdı:

./pdfocf.rb -i source.pdf -o output.pdf

İsteğe bağlı olarak -l LANG parametresini kullanabilirsiniz. Bu durumda tesseract-ocr-LANG paketini kurmanız gerekecek, burada LANG ISO 639-2 dil kodunun üç harfli olduğu. Şimdi 16.04 deposunda 108 diliniz var.

3
user75505

En iyi ve en kolay yolu kullanmak için pypdfocr kullanmak pdf değiştirmez. pypdfocr burada bir python modül bağlantısıdır.

pypdfocr your_document.pdf

Sonunda, aranabilir bir metinle istediğiniz şekilde başka bir your_document_ocr.pdf olacaktır. Uygulamaya, görüntünün kalitesini değiştirmez. Kaplama metnini ekleyerek dosyanın boyutunu biraz yükseltir.

Komutun GUI'ye ihtiyaç duymaması oldukça kolay olduğunu düşünüyorum. Belki de pypdfocr yüklemek biraz daha ayrıntılı:

Sudo apt install tesseract-ocr 
pip install pypdfocr 

Güncelleme 3 Kasım 2018:

pypdfocr, 2016'dan beri artık desteklenmiyor ve telaşlanmadığı için bazı sorunlar fark ettim. ocrmypdf ( module benzer bir iş yapar ve bu şekilde kullanılabilir:

ocrmypdf in.pdf out.pdf

Yüklemek:

pip install ocrmypdf

veya

apt install ocrmypdf
2

gscan2pdf, 3 farklı ocr motoru içerir. Programa doğrudan tarayabilir veya pdf'inizi programa alabilirsiniz. Tesseract motorunun harika çalıştığını ve kullanımının çok kolay olduğunu gördüm

1
Vince West