NOVINKA: Získej 40 hodin praktických dovedností s AI – ZDARMA ke každému akreditovanému kurzu!
Hledáme nové posily do ITnetwork týmu. Podívej se na volné pozice a přidej se do nejagilnější firmy na trhu - Více informací.

Lekce 18 - Klíčové přístupy v datové analýze - EDA a SDA Nové

V předchozí lekci, Etika v datové analýze, jsme se zabývali etikou v datové analýze, identifikací citlivých dat a klíčovými etickými principy.

V dnešním tutoriálu Úvodu do datové analýzy se zaměříme na Exploratory Data Analysis (EDA) a Statistical Data Analysis (SDA). Ukážeme si, proč je důležité nejprve data prozkoumat, jak následně pracovat s hypotézami a jak kombinace obou přístupů vede k přesnějším závěrům.

Průzkumná analýza dat - EDA

Než začneme testovat hypotézy nebo vytvářet modely, potřebujeme si data nejprve takříkajíc osahat. Právě k tomu slouží Exploratory Data Analysis (EDA), tedy průzkumná analýza dat. V této fázi se snažíme pochopit, jak data vypadají, najít v nich vzorce, odchylky nebo jiné zajímavosti. Pomáhá nám to odhalit souvislosti, které bychom při běžném pohledu snadno přehlédli.

K průzkumu dat využíváme jednoduché nástroje, které jsme si již představili. Jsou to popisné statistiky (například průměr, medián nebo rozptyl) a vizualizace (například histogramy nebo korelační matice).

Výsledky z EDA slouží jako první orientace, nikoliv jako důkaz. Ukazují, co může být zajímavé, ne co je definitivně platné.

Ukázkový dataset

Mějme dataset s uživatelským hodnocením produktů:

Dataset pro EDA a SDA - Úvod do datové analýzy a obchodního rozhodování

EDA v praxi

Pojďme se podívat na praktickou ukázku využití


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Koupit tento kurz

Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh za pouhých 350 Kč
Aktuální stav konta 0 Kč
Koupí tohoto balíčku získáš přístup ke všem 21 článkům (21 lekcí) tohoto kurzu.

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

V tutoriálu si ukážeme rozdíl mezi dvěma základními přístupy v datové analýze: Exploratory Data Analysis (EDA) a Statistical Data Analysis (SDA).

Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal Jan Rypáček
Avatar
Jan Rypáček
Aktivity