Lekce 11 - Rozdělení dat - Základní rozdělení Nové
V minulé lekci, Úvod do statistiky - Míry variability, jsme se seznámili se základními statistickými ukazateli, jako jsou rozptyl a směrodatná odchylka.
V této lekci se podíváme na to, jak se data rozprostírají, a zaměříme
se na takzvané normální (Gaussovo) rozdělení. Na rozdíl
od ukazatelů z minulé lekce, které byly jen jedním číslem popisujícím
vzorek, se nyní zaměříme na popis rozdělení vzorku graficky. To je další
způsob, jak se o zkoumaných datech dozvíme více. A my jako analytici o
datech samozřejmě chceme vědět maximum
Jak rozdělení dat ovlivňuje analýzu
V datové analýze se často zajímáme o to, jak jsou hodnoty v našem souboru rozprostřené. Některé veličiny mají většinu hodnot soustředěnou kolem středu, jiné jsou výrazně asymetrické nebo mají extrémní odchylky. Tomu říkáme rozdělení dat. Rozdělení ovlivňuje nejen to, jak data vizualizujeme, ale hlavně jaké metody můžeme použít – například zda můžeme počítat průměr, aplikovat statistické testy nebo modelovat vztahy mezi proměnnými.
Normální rozdělení a jeho typický tvar
Jedním z nejběžnějších rozdělení dat je takzvané normální rozdělení, často označované i jako Gaussovo. Vyznačuje se tím, že většina hodnot se soustředí kolem průměru, zatímco směrem k okrajům jejich četnost rychle klesá. Na grafu tak vzniká charakteristická zvonová křivka, která je symetrická vůči středu. Pokud data sledují normální rozdělení, můžeme o nich snadno dělat odhady a používat běžné statistické metody.
Zvonová křivka ilustrující normální rozdělení:
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit tento kurz
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
V tutoriálu datové analýzy se podíváme na to, jak se data rozprostírají, a zaměříme se na tzv. normální (Gaussovo) rozdělení.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.