NOVINKA: Získej 40 hodin praktických dovedností s AI – ZDARMA ke každému akreditovanému kurzu!
Hledáme nové posily do ITnetwork týmu. Podívej se na volné pozice a přidej se do nejagilnější firmy na trhu - Více informací.

Lekce 11 - Rozdělení dat - Základní rozdělení Nové

V minulé lekci, Úvod do statistiky - Míry variability, jsme se seznámili se základními statistickými ukazateli, jako jsou rozptyl a směrodatná odchylka.

V této lekci se podíváme na to, jak se data rozprostírají, a zaměříme se na takzvané normální (Gaussovo) rozdělení. Na rozdíl od ukazatelů z minulé lekce, které byly jen jedním číslem popisujícím vzorek, se nyní zaměříme na popis rozdělení vzorku graficky. To je další způsob, jak se o zkoumaných datech dozvíme více. A my jako analytici o datech samozřejmě chceme vědět maximum :)

Jak rozdělení dat ovlivňuje analýzu

V datové analýze se často zajímáme o to, jak jsou hodnoty v našem souboru rozprostřené. Některé veličiny mají většinu hodnot soustředěnou kolem středu, jiné jsou výrazně asymetrické nebo mají extrémní odchylky. Tomu říkáme rozdělení dat. Rozdělení ovlivňuje nejen to, jak data vizualizujeme, ale hlavně jaké metody můžeme použít – například zda můžeme počítat průměr, aplikovat statistické testy nebo modelovat vztahy mezi proměnnými.

Normální rozdělení a jeho typický tvar

Jedním z nejběžnějších rozdělení dat je takzvané normální rozdělení, často označované i jako Gaussovo. Vyznačuje se tím, že většina hodnot se soustředí kolem průměru, zatímco směrem k okrajům jejich četnost rychle klesá. Na grafu tak vzniká charakteristická zvonová křivka, která je symetrická vůči středu. Pokud data sledují normální rozdělení, můžeme o nich snadno dělat odhady a používat běžné statistické metody.

Zvonová křivka ilustrující normální rozdělení:


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Koupit tento kurz

Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh za pouhých 300 Kč
Aktuální stav konta 0 Kč
Koupí tohoto balíčku získáš přístup ke všem 19 článkům (19 lekcí) tohoto kurzu.

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

V tutoriálu datové analýzy se podíváme na to, jak se data rozprostírají, a zaměříme se na tzv. normální (Gaussovo) rozdělení.

Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal Jan Rypáček
Avatar
Jan Rypáček
Aktivity