Pouze tento týden sleva až 80 % na e-learning týkající se C# .NET
Nauč se s námi víc. Využij 50% zdarma na e-learningové kurzy.
discount week 50

Lekce 10 - Shlukovací algoritmus K-Means v Pythonu

V minulé lekci, Les rozhodovacích stromů v Pythonu, jsme se podívali na les rozhodovacích stromů a otestovali jsme ho na Iris dataset.

V tomto tutoriálu o strojovém učení se podíváme na algoritmus z rodiny algoritmů "učení bez dohledu" a tím je K-Means. Tento algoritmus nepotřebuje znát náš požadovaný výstup, ale postupným iterováním rozdělí data do K skupin, což je parametr, který definujeme. Tímto způsobem může algoritmus najít další vzory nebo vztahy v datech, kterých si nemusíme ani všimnout.

K-Means můžeme využít v reálném světě například k rozdělení zákazníků do K skupin, kde každá skupina bude mít vždy něco společného (např. ti, co nakupují boty, co nakupují pravidelně, sváteční nakupovači, šetřílci, ...). Jediný problém je, že vám algoritmus ukáže pouze kdo do jaké skupiny patří, ale ne co mají za unikátní vlastnost / co mají společného. To také uvidíme v praktické ukázce v Pythonu.

Jak funguje shlukovací algoritmus K-Means

Řekněme, že máme následující body a chceme je rozdělit do K skupin. Metodou KV (kouknu a vidím) si můžeme všimnou, že jsou zde 2 skupiny bodů a můžeme je jednoduše rozdělit:

Skupiny vypadají takto:

Centroid

Algoritmus K-Means ale neví, kolik je zde potenciálních skupin ani kde každá z nich leží. Každá skupina (jejich počet definuje parametr K) má svůj centroid, což je


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Omezená nabídka: Nauč se vše a ušetři

Koupit lekce a funkce postupně a po jednom 120 bodů
Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh za exkluzivní cenu 102 bodů (255 Kč)
Na svém účtu máš aktuálně 0 bodů
Koupí tohoto výhodného balíčku získáš přístup ke všem 15 lekcím s kontrolou a certifikací a ještě navíc ušetříš 45 Kč. Nabídka je omezená pouze pro první lekce z kurzu a obsahuje exkluzivní slevu 15%.
102 bodů získáš za přidání svého článku na síť nebo odpovídá 300 Kč 255 Kč

Pozor, pokud si koupíš pouze tuto lekci, ztratíš nárok na speciální slevu 15% na balíček všech lekcí.

Koupit jen lekci 10 bodů
Na svém účtu máš aktuálně 0 bodů
10 bodů získáš za přidání svého článku na síť nebo odpovídá 25 Kč

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

V Python tutoriálu si představíme algoritmus K-Means z rodiny algoritmů Učení bez dohledu. Rozdělíme si pomocí něj Iris dataset a otestujeme jeho přesnost.

Body získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal MQ .
Avatar
Používám hlavně Python a zajímám se o Deep Learning a vše kolem.
Aktivity