Vydělávej až 160.000 Kč měsíčně! Akreditované rekvalifikační kurzy s garancí práce od 0 Kč. Více informací.
Hledáme nové posily do ITnetwork týmu. Podívej se na volné pozice a přidej se do nejagilnější firmy na trhu - Více informací.

Lekce 10 - Shlukovací algoritmus K-Means v Pythonu

V minulé lekci, Les rozhodovacích stromů v Pythonu, jsme se podívali na les rozhodovacích stromů a otestovali jsme ho na Iris dataset.

V tomto tutoriálu o strojovém učení se podíváme na algoritmus z rodiny algoritmů "učení bez dohledu" a tím je K-Means. Tento algoritmus nepotřebuje znát náš požadovaný výstup, ale postupným iterováním rozdělí data do K skupin, což je parametr, který definujeme. Tímto způsobem může algoritmus najít další vzory nebo vztahy v datech, kterých si nemusíme ani všimnout.

K-Means můžeme využít v reálném světě například k rozdělení zákazníků do K skupin, kde každá skupina bude mít vždy něco společného (např. ti, co nakupují boty, co nakupují pravidelně, sváteční nakupovači, šetřílci, ...). Jediný problém je, že vám algoritmus ukáže pouze kdo do jaké skupiny patří, ale ne co mají za unikátní vlastnost / co mají společného. To také uvidíme v praktické ukázce v Pythonu.

Jak funguje shlukovací algoritmus K-Means

Řekněme, že máme následující body a chceme je rozdělit do K skupin. Metodou KV (kouknu a vidím) si můžeme všimnou, že jsou zde 2 skupiny bodů a můžeme je jednoduše rozdělit:

Skupiny vypadají takto:

Centroid

Algoritmus K-Means ale neví, kolik je zde potenciálních skupin ani kde každá z nich leží. Každá skupina (jejich počet definuje parametr K) má svůj centroid, což je


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Koupit tento kurz

Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh za pouhých 675 Kč
Aktuální stav konta 0 Kč
Koupí tohoto balíčku získáš přístup ke všem 22 článkům (18 lekcí, 4 testy) tohoto kurzu.

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

V Python tutoriálu si představíme algoritmus K-Means z rodiny algoritmů Učení bez dohledu. Rozdělíme si pomocí něj Iris dataset a otestujeme jeho přesnost.

Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal MQ .
Avatar
Používám hlavně Python a zajímám se o Deep Learning a vše kolem.
Aktivity