Lekce 10 - Shlukovací algoritmus K-Means v Pythonu
V minulé lekci, Les rozhodovacích stromů v Pythonu, jsme se podívali na les rozhodovacích stromů a otestovali jsme ho na Iris dataset.
V tomto tutoriálu o strojovém učení se podíváme na algoritmus z rodiny
algoritmů "učení bez dohledu" a tím je K-Means. Tento algoritmus
nepotřebuje znát náš požadovaný výstup, ale postupným iterováním
rozdělí data do K
skupin, což je parametr, který definujeme.
Tímto způsobem může algoritmus najít další vzory nebo vztahy v datech,
kterých si nemusíme ani všimnout.
K-Means můžeme využít v reálném světě například k rozdělení
zákazníků do K
skupin, kde každá skupina bude mít vždy něco
společného (např. ti, co nakupují boty, co nakupují pravidelně,
sváteční nakupovači, šetřílci, ...). Jediný problém je, že vám
algoritmus ukáže pouze kdo do jaké skupiny patří, ale ne co mají za
unikátní vlastnost / co mají společného. To také uvidíme v praktické
ukázce v Pythonu.
Jak funguje shlukovací algoritmus K-Means
Řekněme, že máme následující body a chceme je rozdělit do
K
skupin. Metodou KV (kouknu a vidím) si můžeme všimnou, že
jsou zde 2 skupiny bodů a můžeme je jednoduše rozdělit:
Skupiny vypadají takto:
Centroid
Algoritmus K-Means ale neví, kolik je zde potenciálních skupin ani kde
každá z nich leží. Každá skupina (jejich počet definuje parametr
K
) má svůj centroid, což je
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit tento kurz
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
V Python tutoriálu si představíme algoritmus K-Means z rodiny algoritmů Učení bez dohledu. Rozdělíme si pomocí něj Iris dataset a otestujeme jeho přesnost.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.