Zdravím všechny, rád bych extrahoval data do xml z pdf. V příloze
přikládám obrázek s adresou a v červeném rámečku je pdf ke stažení.
Výsledek ve formě xml, jehož jsem dosáhl pomocí apl. foxit reader je taky
přiložen. Nejsem programátor, ale vynasnažím se, abych porozuměl. Vím,
že toho lze dosáhnout pomocí knihovny PDFBOX, ale potřebuji aspoň obecný
návod jak na to.
Zkusil jsem: Zkoušel jsem udělat něco podle youtube, ale bez
úspěchu.
Chci docílit: Výsledek má být ten, že mám v jednom adresáři 100 pdf a
rád bych z nich extrahoval 100 xml tedy pokud lze z pdf něco extrahovat.
Děkuji všem za jakoukoliv pomoc. M.
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.