Avatar
Paul
Člen
Avatar
Paul:

Ahoj, rád bych vás vyzpovídal, jestli někdo nemáte nějaký tip na dobrou Javovskou knihovnu, která by my pomohla s OCR. Potřeboval bych naprogramovat aplikaci, která bude vytěžovat textová data z PDF a ukládat do formátu se kerým se bude dále pracovat. Předem díky za jakoukoliv radu.

 
Odpovědět  -1 4.12.2013 14:59
Avatar
Silvinios
Redaktor
Avatar
Odpovídá na Paul
Silvinios:

Kamarád používá Tesseract a je sním celkem spokojen. Tento OCR engine původně vyvíjelo HP. Později byl engine uvolněn jako open source.
https://code.google.com/…sseract-ocr/

Pro Javu existuje wrapper Tess4J (nezkoušel jsem):
http://tess4j.sourceforge.net/

 
Nahoru Odpovědět 4.12.2013 17:38
Avatar
Paul
Člen
Avatar
Paul:

Díky, o Tesseractu vím a chystám se ho vyzkoušet. Pak dám vědět co a jak. Myslel jsem jestli někdo nemá v rukávu ještě nějakej jinej tip :-)

 
Nahoru Odpovědět 7.12.2013 11:50
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 3 zpráv z 3.