Lekce 26 - NumPy - Filtrování dat
V předchozí lekci, NumPy - Výběr dat - Pohled a kopie, jsme si vysvětlili rozdíl mezi pohledy a kopiemi při slicingu v NumPy.
V dnešním tutoriálu knihovny NumPy v Pythonu si vysvětlíme postup při filtrování hodnot polí pomocí polí booleovských hodnot. Porovnáme si filtrování nativním Pythonem s filtrováním pomocí knihovny NumPy.
Filtrování nativním Pythonem
Začneme tím, že si ujasníme pojem filtrování dat. Princip filtrování v základu implementuje i nativní Python a často se s ním setkáme i při použití knihovny Pandas. Nejlépe si filtrování vysvětlíme na příkladu z datové vědy.
Příklad
Mějme tedy několik polí, kdy každé obsahuje jiný typ hodnot. Dohromady vytvářejí takovou malou "databázovou" tabulku. Například jména studentů ve třídě a datumy jejich narození:
studenti_jmena = np.array([ 'Terka', 'Jakub', 'Evžen' ]) studenti_rok = np.array([ 2006, 2005, 2006 ])
Nyní budeme chtít najít jen studenty, kteří se narodili v roce
2006
. K tomu slouží právě filtrování.
V nativním Pythonu si vytvoříme seznam booleovských
hodnot (list
) stejné délky, jako je počet položek v
původním poli. Na každou pozici seznamu doplníme True
nebo
False
podle toho, zda hodnota splňuje naši podmínku. Pomocí
tohoto boolean seznamu pak můžeme filtrovat původní data.
Pro naši konkrétní minidatabázi chceme dosáhnout hodnot
[True, False, True]
. Je více způsobů, jak takový seznam
vytvořit. Ukážeme si dva způsoby:
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit tento kurz
Před koupí tohoto článku je třeba koupit předchozí díl
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
V tutoriálu knihovny NumPy v Pythonu si vysvětlíme postup při filtrování hodnot polí pomocí polí booleovských hodnot.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.