První novoroční výprodej Java týden
Hledáš brigádu v IT, která bude 100 % home office a 100 % flexibilní? Pak napiš na: redakce [zavináč] itnetwork.cz pro více info!
80 % bodů zdarma díky akci Black Friday! Tento týden rovněž sleva na e-learning Java až 80 %
Avatar
Marek Koc
Člen
Avatar
Marek Koc:10.12.2019 14:35

Zdravím všechny, rád bych extrahoval data do xml z pdf. V příloze přikládám obrázek s adresou a v červeném rámečku je pdf ke stažení. Výsledek ve formě xml, jehož jsem dosáhl pomocí apl. foxit reader je taky přiložen. Nejsem programátor, ale vynasnažím se, abych porozuměl. Vím, že toho lze dosáhnout pomocí knihovny PDFBOX, ale potřebuji aspoň obecný návod jak na to.

Zkusil jsem: Zkoušel jsem udělat něco podle youtube, ale bez úspěchu.

Chci docílit: Výsledek má být ten, že mám v jednom adresáři 100 pdf a rád bych z nich extrahoval 100 xml tedy pokud lze z pdf něco extrahovat. Děkuji všem za jakoukoliv ​pomoc. M.

 
Odpovědět
10.12.2019 14:35
Naši partneři možná hledají právě tebe!
Avatar
Marek Koc
Člen
Avatar
Odpovídá na Marek Koc
Marek Koc:10.12.2019 15:33

Jenom pro doplnění, pdf je ve specifikaci XFA tj. interaktivní.

 
Nahoru Odpovědět
10.12.2019 15:33
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 2 zpráv z 2.