POUZE NYNÍ: Získej až 80 % extra kreditů ZDARMA na náš interaktivní e-learning. Zjistit více.
NOVINKA: Staň se datovým analytikem od 0 Kč a získej jistotu práce, lepší plat a nové kariérní možnosti. Více informací:

Lekce 23 - Klíčové přístupy v datové analýze - EDA a SDA

V předchozí lekci, Etika v datové analýze, jsme se zabývali etikou v datové analýze, identifikací citlivých dat a klíčovými etickými principy.

V dnešním tutoriálu Úvodu do datové analýzy se zaměříme na Exploratory Data Analysis (EDA) a Statistical Data Analysis (SDA). Ukážeme si, proč je důležité nejprve data prozkoumat, jak následně pracovat s hypotézami a jak kombinace obou přístupů vede k přesnějším závěrům.

Průzkumná analýza dat - EDA

Než začneme testovat hypotézy nebo vytvářet modely, potřebujeme si data nejprve takříkajíc osahat. Právě k tomu slouží Exploratory Data Analysis (EDA), tedy průzkumná analýza dat. V této fázi se snažíme pochopit, jak data vypadají, najít v nich vzorce, odchylky nebo jiné zajímavosti. Pomáhá nám to odhalit souvislosti, které bychom při běžném pohledu snadno přehlédli.

K průzkumu dat využíváme jednoduché nástroje, které jsme si již představili. Jsou to popisné statistiky (například průměr, medián nebo rozptyl) a vizualizace (například sloupcové grafy, histogramy nebo korelační matice).

Výsledky z EDA slouží jako první orientace, nikoliv jako důkaz. Ukazují, co může být zajímavé, ne co je definitivně platné.

Ukázkový dataset

Nyní přejděte na konec lekce a stáhněte si archiv v příloze. Po rozbalení otevřete soubor dataset_hodnoceni_v2.xlsx a vraťte se v lekci zpět na toto místo. Jedná se o dataset s uživatelským hodnocením produktů:

Dataset pro EDA a SDA - Úvod do datové analýzy a obchodního rozhodování

EDA v praxi

Pojďme se podívat na praktickou ukázku využití


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Koupit tento kurz

Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh a certifikátem za pouhých 1 350 Kč
Aktuální stav konta 0 Kč
Koupí tohoto balíčku získáš přístup ke všem 45 článkům (31 lekcí, 7 praktických cvičení, 7 testů) tohoto kurzu.

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

V tutoriálu si ukážeme rozdíl mezi dvěma základními přístupy v datové analýze: Exploratory Data Analysis (EDA) a Statistical Data Analysis (SDA).

Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal Jan Rypáček
Avatar
Jan Rypáček
Aktivity