Vydělávej až 160.000 Kč měsíčně! Akreditované rekvalifikační kurzy s garancí práce od 0 Kč. Více informací.
Hledáme nové posily do ITnetwork týmu. Podívej se na volné pozice a přidej se do nejagilnější firmy na trhu - Více informací.
Avatar
Paul
Člen
Avatar
Paul:4.12.2013 14:59

Ahoj, rád bych vás vyzpovídal, jestli někdo nemáte nějaký tip na dobrou Javovskou knihovnu, která by my pomohla s OCR. Potřeboval bych naprogramovat aplikaci, která bude vytěžovat textová data z PDF a ukládat do formátu se kerým se bude dále pracovat. Předem díky za jakoukoliv radu.

 
Odpovědět
4.12.2013 14:59
Avatar
Silvinios
Tvůrce
Avatar
Odpovídá na Paul
Silvinios:4.12.2013 17:38

Kamarád používá Tesseract a je sním celkem spokojen. Tento OCR engine původně vyvíjelo HP. Později byl engine uvolněn jako open source.
https://code.google.com/…sseract-ocr/

Pro Javu existuje wrapper Tess4J (nezkoušel jsem):
http://tess4j.sourceforge.net/

 
Nahoru Odpovědět
4.12.2013 17:38
Avatar
Paul
Člen
Avatar
Paul:7.12.2013 11:50

Díky, o Tesseractu vím a chystám se ho vyzkoušet. Pak dám vědět co a jak. Myslel jsem jestli někdo nemá v rukávu ještě nějakej jinej tip :-)

 
Nahoru Odpovědět
7.12.2013 11:50
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 3 zpráv z 3.