Práce se soubory

Získej certifikát za dokončení kurzu
0/25

Výjimky v Pythonu

Úvod do práce se soubory v Pythonu

Práce s textovými soubory v Pythonu

Uložení objektů do CSV v Pythonu

Uložení objektů do CSV v Pythonu část 2

Řešené úlohy k 1.-5. lekci práce se soubory v Pythonu

Úvod do formátu XML v Pythonu

Zápis a čtení XML souborů v Pythonu

Binární soubory a serializace v Pythonu

Řešené úlohy k 6.-8. lekci práce se soubory v Pythonu

Výjimky v Pythonu podruhé

Práce se soubory INI v Pythonu

Soubory a cesty v Pythonu

Práce se složkami v Pythonu

Práce se ZIP archivy v Pythonu - Vytvoření, zápis a metadata

Práce se ZIP archivy v Pythonu - Čtení a zápis do souborů

Práce se ZIP archivy v Pythonu - Extrakce a komprese

Práce se soubory DocX v Pythonu - Vytvoření, text a nadpis

Práce se soubory DocX v Pythonu - Obrázky a tabulky

Práce se soubory DocX v Pythonu - Čtení a struktura

Práce se soubory DocX v Pythonu - Analýza bloků

Práce s PDF soubory v Pythonu - Čtení a extrakce dat

Práce s PDF soubory v Pythonu – Obrázky a tabulky

Práce s PDF soubory v Pythonu – PDF soubory z HTML šablony

Kvíz - Soubory v Python

Lekce 21 - Práce s PDF soubory v Pythonu – Obrázky a tabulky

V minulé lekci, Práce s PDF soubory v Pythonu - Čtení a extrakce dat, jsme si ukázali jak číst a extrahovat data z PDF souborů pomocí knihovny PyMuPDF.

V následujícím tutoriálu práce s PDF soubory v Pythonu budeme pokračovat ve čtení a extrakci dat z PDF souboru. Kromě textu, který už načíst umíme, chceme také informace o obrázcích a tabulkách. K tomu opět využijeme metodu get_text(), tentokrát ovšem s argumentem json.

Využití JSON k analýze PDF

Formát JSON nám poskytne detailní strukturu souboru. Pojďme se tedy podívat na strukturu čtvrté strany našeho modelového dokumentu. Postupujeme následovně:

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Před koupí tohoto článku je třeba koupit předchozí díl

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?

Přístup k jednotlivým lekcím dle způsobu pořízení.
Kvalitní znalosti v oblasti IT.
Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

V následujícím tutoriálu práce s PDF soubory v Pythonu dokončíme naši čtečku PDF souborů. Použijeme knihovny PyMuPDF a camelot.

Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal Jakub Jakubec

Aktivity

Nejčastěji vyhledáváné

Lekce 21 - Práce s PDF soubory v Pythonu – Obrázky a tabulky

Využití JSON k analýze PDF

Popis článku