Aktuálně: Postihly zákazy tvou profesi? Poptávka po ajťácích prudce roste, využij slevové akce 30% výuky zdarma!

Lekce 10 - Shlukovací algoritmus K-Means v Pythonu

V minulé lekci, Les rozhodovacích stromů v Pythonu, jsme se v našem kurzu věnovali lesu rozhodovacích stromů. V tomto tutoriálu o strojovém učení se podíváme na algoritmus z rodiny algoritmů "učení bez dohledu" a tím je K-Means. Tento algoritmus nepotřebuje znát náš požadovaný výstup, ale postupným iterováním rozdělí data do K skupin, což je parametr, který definujeme. Tímto způsobem může algoritmus najít další vzory nebo vztahy v datech, kterých si nemusíme ani všimnout.

K-Means můžeme využít v reálném světě například k rozdělení zákazníků do K skupin, kde každá skupina bude mít vždy něco společného (např. ti, co nakupují boty, co nakupují pravidelně, sváteční nakupovači, šetřílci, ...). Jediný problém je, že vám algoritmus ukáže pouze kdo do jaké skupiny patří, ale ne co mají za unikátní vlastnost / co mají společného. To také uvidíme v praktické ukázce v Pythonu.

Jak funguje shlukovací algoritmus K-Means

Řekněme, že máme následující body a chceme je rozdělit do K skupin. Metodou KV (kouknu a vidím) si můžeme všimnou, že jsou zde 2 skupiny bodů a můžeme je jednoduše rozdělit:

Skupiny vypadají takto:

Centroid

Algoritmus K-Means ale neví, kolik je zde potenciálních skupin ani kde každá z nich leží. Každá skupina (jejich počet definuje parametr K) má svůj centroid, což je


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Omezená nabídka: Nauč se vše a ušetři

Koupit lekce a funkce postupně a po jednom 100 bodů
Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh za exkluzivní cenu 85 bodů (212 Kč)
Na svém účtu máš aktuálně 0 bodů
Koupí tohoto výhodného balíčku získáš přístup ke všem 13 lekcím s kontrolou a certifikací a ještě navíc ušetříš 38 Kč. Nabídka je omezená pouze pro první lekce z kurzu a obsahuje exkluzivní slevu 15%.
85 bodů získáš za přidání svého článku na síť nebo odpovídá 250 Kč 212 Kč

Pozor, pokud si koupíš pouze tuto lekci, ztratíš nárok na speciální slevu 15% na balíček všech lekcí.

Koupit jen lekci 10 bodů
Na svém účtu máš aktuálně 0 bodů
10 bodů získáš za přidání svého článku na síť nebo odpovídá 25 Kč

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

V Python tutoriálu si představíme algoritmus K-Means z rodiny algoritmů Učení bez dohledu. Rozdělíme si pomocí něj Iris dataset a otestujeme jeho přesnost.

Body získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal MQ .
Avatar
Používám hlavně Python a zajímám se o Deep Learning a vše kolem.
Aktivity (4)