NOVINKA: Pracuj až o 60 % rychleji díky akreditovanému kurzu Specialista na AI. Nyní již od 0 Kč. Zjisti více:
LETNÍ AKCE BRZY KONČÍ! Ještě dnes můžeš získat až 90 % extra kreditů ZDARMA při dobití od 1199 kreditů s promo kódem PREHRADA90.

Lekce 12 - Rozdělení dat - Základní rozdělení Nové

V minulé lekci, Úvod do statistiky - Míry variability, jsme se seznámili se základními statistickými ukazateli, jako jsou rozptyl a směrodatná odchylka.

V této lekci se podíváme na to, jak se data rozprostírají, a zaměříme se na takzvané normální (Gaussovo) rozdělení. Na rozdíl od ukazatelů z minulé lekce, které byly jen jedním číslem popisujícím vzorek, se nyní soustředíme na popis rozdělení vzorku graficky. To je další způsob, jak se o zkoumaných datech můžeme dozvědět více. A my jako analytici o datech samozřejmě chceme vědět maximum :)

Jak rozdělení dat ovlivňuje analýzu

V datové analýze se často zajímáme o to, jak jsou hodnoty v našem souboru rozprostřené. Některé veličiny mají většinu hodnot soustředěnou kolem středu, jiné jsou výrazně asymetrické nebo mají extrémní odchylky. Tomu říkáme rozdělení dat. Rozdělení ovlivňuje nejen to, jak data vizualizujeme, ale hlavně jaké metody můžeme použít – například zda můžeme počítat průměr, aplikovat statistické testy nebo modelovat vztahy mezi proměnnými.

Normální rozdělení a jeho typický tvar

Jedním z nejběžnějších rozdělení dat je takzvané normální rozdělení, často označované i jako Gaussovo. Vyznačuje se tím, že většina hodnot se soustředí kolem průměru, zatímco směrem k okrajům jejich četnost rychle klesá. Na grafu tak vzniká charakteristická zvonová křivka, která je symetrická vůči středu. Pokud data sledují normální rozdělení, můžeme u nich snadno provádět odhady a používat běžné statistické metody.

Zvonová křivka ilustrující normální rozdělení:


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Koupit tento kurz

Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh za pouhých 475 Kč
Aktuální stav konta 0 Kč
Koupí tohoto balíčku získáš přístup ke všem 27 článkům (27 lekcí) tohoto kurzu.

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

V tutoriálu datové analýzy se podíváme na to, jak se data rozprostírají, a zaměříme se na tzv. normální (Gaussovo) rozdělení.

Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal Jan Rypáček
Avatar
Jan Rypáček
Aktivity