Diskuze: Extrahování dat z pdf

V předchozím kvízu, Online test znalostí Java, jsme si ověřili nabyté zkušenosti z kurzu.

Aktivity

Marek Koc

Člen

Marek Koc:10.12.2019 14:35

Zdravím všechny, rád bych extrahoval data do xml z pdf. V příloze přikládám obrázek s adresou a v červeném rámečku je pdf ke stažení. Výsledek ve formě xml, jehož jsem dosáhl pomocí apl. foxit reader je taky přiložen. Nejsem programátor, ale vynasnažím se, abych porozuměl. Vím, že toho lze dosáhnout pomocí knihovny PDFBOX, ale potřebuji aspoň obecný návod jak na to.

Zkusil jsem: Zkoušel jsem udělat něco podle youtube, ale bez úspěchu.

Chci docílit: Výsledek má být ten, že mám v jednom adresáři 100 pdf a rád bych z nich extrahoval 100 xml tedy pokud lze z pdf něco extrahovat. Děkuji všem za jakoukoliv pomoc. M.

Odpovědět

10.12.2019 14:35

Marek Koc

Člen

Marek Koc:10.12.2019 15:33

Jenom pro doplnění, pdf je ve specifikaci XFA tj. interaktivní.

Nahoru Odpovědět

10.12.2019 15:33

Naučíme tě pracovat na home-office.

Zjistit více...

Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 2 zpráv z 2.

Nejčastěji vyhledáváné

Diskuze: Extrahování dat z pdf