Pouze tento týden sleva až 80 % na HTML & CSS a JavaScript
80 % bodů zdarma na online výuku díky naší Letní akci!

Lekce 10 - Shlukovací algoritmus K-Means v Pythonu

V minulé lekci, Les rozhodovacích stromů v Pythonu, jsme se v našem kurzu věnovali lesu rozhodovacích stromů. V tomto tutoriálu o strojovém učení se podíváme na algoritmus z rodiny algoritmů "učení bez dohledu" a tím je K-Means. Tento algoritmus nepotřebuje znát náš požadovaný výstup, ale postupným iterováním rozdělí data do K skupin, což je parametr, který definujeme. Tímto způsobem může algoritmus najít další vzory nebo vztahy v datech, kterých si nemusíme ani všimnout.

K-Means můžeme využít v reálném světě například k rozdělení zákazníků do K skupin, kde každá skupina bude mít vždy něco společného (např. ti, co nakupují boty, co nakupují pravidelně, sváteční nakupovači, šetřílci, ...). Jediný problém je, že vám algoritmus ukáže pouze kdo do jaké skupiny patří, ale ne co mají za unikátní vlastnost / co mají společného. To také uvidíme v praktické ukázce v Pythonu.

Jak funguje shlukovací algoritmus K-Means

Řekněme, že máme následující body a chceme je rozdělit do K skupin. Metodou KV (kouknu a vidím) si můžeme všimnou, že jsou zde 2 skupiny bodů a můžeme je jednoduše rozdělit:

Skupiny vypadají takto:

Centroid

Algoritmus K-Means ale neví, kolik je zde potenciálních skupin ani kde každá z nich leží. Každá skupina (jejich počet definuje parametr K) má svůj centroid, což je


 

...konec náhledu článku...

Prémiový článek

Prémiový článek

Na itnetwork.cz se nachází největší a nejucelenější česká databáze s výukovými články, jejímž cílem je umožnit kvalitní vzdělání v oblasti IT úplně každému. Měsíčně zobrazíme k milionu článků a sklidíme desítky děkovných emailů, kde nám sdělujete, že jsme vám pomohli k lepšímu zaměstnání nebo vzdělání.

Ačkoli se snažíme držet většinu obsahu úplně zadarmo, udržovat síť v provozu a aktuální stojí obrovské úsilí. Proto je nějaký obsah, jako cvičení nebo odbornější články, přístupný pouze za body. Nebojte, nestojí to skoro nic :)

Popis článku

Požadovaný článek má následující obsah:

V Python tutoriálu si představíme algoritmus K-Means z rodiny algoritmů Učení bez dohledu. Rozdělíme si pomocí něj Iris dataset a otestujeme jeho přesnost.

Omezená nabídka: Nauč se vše a ušetři

Koupit články a funkce postupně a po jednom 100 bodů
Koupit všechny aktuálně dostupné články v sekci se všemi funkcemi za exkluzivní cenu 85 bodů
Na svém účtu máš aktuálně 0 bodů
Koupí tohoto výhodného balíčku získáš přístup ke všem 13 článkům s kontrolou a certifikací a ještě navíc ušetříš 38 Kč. Nabídka je omezená pouze pro první články z kurzu a obsahuje exkluzivní slevu 15%.
85 bodů získáš za přidání svého článku na síť nebo odpovídá 250 Kč 212 Kč

Pozor, pokud si koupíš pouze tento článek, ztratíš nárok na speciální slevu 15% na balíček všech článků.

Pro přístup k článku potřebuješ 10 bodů
Na svém účtu máš aktuálně 0 bodů
10 bodů získáš za přidání svého článku na síť nebo odpovídá 25 Kč

Koupí článku k němu získáš neomezený přístup a to napořád. Posuneš své znalosti zas kousek dopředu a zároveň nám pomůžeš udržovat celý projekt při životě a pomáhat vám tak k lepší budoucnosti.

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Body získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Dobít body můžeš okamžitě např.:

Kartou SMS Převodem
Kartou SMS Převodem
Článek pro vás napsal MQ .
Avatar
Používám hlavně Python a zajímám se o Deep Learning a vše kolem.
Aktivity (4)