Lekce 19 - Transformace dat - Normalizace a standardizace
V minulé lekci, Čištění dat, jsme se věnovali čištění dat, tedy identifikaci a odstranění chyb při datové analýze.
V dnešním tutoriálu Úvodu do datové analýzy se zaměříme na techniky normalizace a standardizace. Nakonec se podíváme na odlehlé hodnoty.
Motivace
Při analýze dat je důležité, abychom data mohli navzájem správně porovnávat. To nemusí být jednoduché, pokud mají různé sloupce různé rozsahy hodnot.
Normalizace
Normalizace je proces, který nám pomáhá upravit data tak, aby byla ve srovnatelném měřítku.
Min-Max normalizace
Nejčastěji používanou metodou normalizace je Min-Max
normalizace. Ta převede všechny hodnoty dané proměnné tak, aby
nejmenší hodnota byla 0
a
největší 1
.
Příklad - Známky
Představme si, že máme sadu známek od 1 do 5:

Min-Max normalizace by známku 1
převedla na
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit tento kurz
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
V tutoriálu datové analýzy se seznámíme s transformací dat pomocí normalizace a standardizace a s odlehlými hodnotami.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.