Black Friday je tu! Využij jedinečnou příležitost a získej až 80 % znalostí navíc zdarma! Více zde
Hledáme nové posily do ITnetwork týmu. Podívej se na volné pozice a přidej se do nejagilnější firmy na trhu - Více informací.
BF extended 2022
Avatar
Marek Koc
Člen
Avatar
Marek Koc:10.12.2019 14:35

Zdravím všechny, rád bych extrahoval data do xml z pdf. V příloze přikládám obrázek s adresou a v červeném rámečku je pdf ke stažení. Výsledek ve formě xml, jehož jsem dosáhl pomocí apl. foxit reader je taky přiložen. Nejsem programátor, ale vynasnažím se, abych porozuměl. Vím, že toho lze dosáhnout pomocí knihovny PDFBOX, ale potřebuji aspoň obecný návod jak na to.

Zkusil jsem: Zkoušel jsem udělat něco podle youtube, ale bez úspěchu.

Chci docílit: Výsledek má být ten, že mám v jednom adresáři 100 pdf a rád bych z nich extrahoval 100 xml tedy pokud lze z pdf něco extrahovat. Děkuji všem za jakoukoliv ​pomoc. M.

 
Odpovědět
10.12.2019 14:35
Avatar
Marek Koc
Člen
Avatar
Odpovídá na Marek Koc
Marek Koc:10.12.2019 15:33

Jenom pro doplnění, pdf je ve specifikaci XFA tj. interaktivní.

 
Nahoru Odpovědět
10.12.2019 15:33
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 2 zpráv z 2.