Lekce 19 - Filtrování dat
V předchozí lekci, Vytváření funkcí typu ufunc a práce s nimi, jsme se naučili vytvářet vlastní funkce
typu ufunc
a také jsme si ukázali použití funkcí
reduce()
a accumulate()
, které dále rozšiřují
možnosti použití ufunc
.
V následujícím tutoriálu knihovny NumPy v Pythonu si vysvětlíme postup při filtrování hodnot polí pomocí polí booleovských hodnot. Ukážeme si možnosti, které nám v tomto případě dává knihovna NumPy.
Filtrování dat
Začneme tím, že si ujasníme pojem "filtrování". Princip filtrování v základu implementuje i nativní Python a často se s ním setkáme i při používání knihovny Pandas. Nejlépe si filtrování vysvětlíme na příkladu z datové vědy. Mějme tedy několik polí, kdy každé obsahuje jiný typ hodnot. Dohromady vytvářejí takovou malou "databázovou" tabulku. Například jména studentů ve třídě a datumy jejich narození:
studenti_jmena = np.array([ 'Terka', 'Jakub', 'Evžen' ]) studenti_rok = np.array([ 2006, 2005, 2006 ])
Nyní budeme chtít najít jen studenty, kteří se narodili v roce 2006. K
tomu slouží právě filtrování. Vytvoříme pole stejné délky, jako je
počet položek v originálním poli, ale na každou pozici pomocí
True/False
doplníme, zda splňuje naši podmínku. Pomocí tohoto
boolean pole pak jednoduše "profiltrujeme" originální pole a vytvoříme
nové. To už bude mít pouze požadované hodnoty. Pro naši konkrétní
minidatabázi chceme dosáhnout hodnot [True, False, True]
. Je
více způsobů, jak takové pole vytvořit. Ukážeme si dva jednoduché:
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit tento kurz
Před koupí tohoto článku je třeba koupit předchozí díl
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
V tutoriálu knihovny NumPy si vysvětlíme postup při filtrování hodnot polí pomocí polí booleovských hodnot.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.