NOVINKA - Online rekvalifikační kurz Python programátor. Oblíbená a studenty ověřená rekvalifikace - nyní i online.
Hledáme nové posily do ITnetwork týmu. Podívej se na volné pozice a přidej se do nejagilnější firmy na trhu - Více informací.
Funkce, kterou se snažíš použít je dostupná pouze pro registrované uživatele. Buďto se přihlas nebo si zdarma vytvoř nový účet.
Funkce, kterou se snažíš použít je dostupná pouze pro registrované uživatele. Buďto se přihlas nebo si zdarma vytvoř nový účet.

Lekce 26 - NumPy - Filtrování dat

V předchozí lekci, NumPy - Výběr dat - Pohled a kopie, jsme si vysvětlili rozdíl mezi pohledy a kopiemi při slicingu v NumPy.

V dnešním tutoriálu knihovny NumPy v Pythonu si vysvětlíme postup při filtrování hodnot polí pomocí polí booleovských hodnot. Porovnáme si filtrování nativním Pythonem s filtrováním pomocí knihovny NumPy.

Filtrování nativním Pythonem

Začneme tím, že si ujasníme pojem filtrování dat. Princip filtrování v základu implementuje i nativní Python a často se s ním setkáme i při použití knihovny Pandas. Nejlépe si filtrování vysvětlíme na příkladu z datové vědy.

Příklad

Mějme tedy několik polí, kdy každé obsahuje jiný typ hodnot. Dohromady vytvářejí takovou malou "databázovou" tabulku. Například jména studentů ve třídě a datumy jejich narození:

studenti_jmena = np.array([
                            'Terka',
                            'Jakub',
                            'Evžen'
                        ])
studenti_rok = np.array([
                            2006,
                            2005,
                            2006
                        ])

Nyní budeme chtít najít jen studenty, kteří se narodili v roce 2006. K tomu slouží právě filtrování. Vytvoříme pole stejné délky, jako je počet položek v originálním poli. Na každou pozici pole doplníme pomocí True/False, zda splňuje naši podmínku. Pomocí tohoto boolean pole pak jednoduše profiltrujeme originální pole a vytvoříme nové pole, které už bude mít pouze požadované hodnoty. Pro naši konkrétní minidatabázi chceme dosáhnout hodnot [True, False, True]. Je více způsobů, jak takové pole vytvořit. Ukážeme si dva způsoby:


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Koupit tento kurz

Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh a certifikátem za pouhých 1 350 Kč
Aktuální stav konta 0 Kč
Koupí tohoto balíčku získáš přístup ke všem 36 článkům (28 lekcí, 8 testů) tohoto kurzu.

Před koupí tohoto článku je třeba koupit předchozí díl

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

V tutoriálu knihovny NumPy v Pythonu si vysvětlíme postup při filtrování hodnot polí pomocí polí booleovských hodnot.

Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal Miloš Halda
Avatar
Autor se věnuje především bioinformatice a s ní souvisejícím tématům. Nevyhýbá se OOP jazykům, statistice a nástrojům pro analýzu dat.
Aktivity