Lekce 8 - Data Mining - Vyhodnocení produkce odpadu - Statistický test
V minulé lekci, Data Mining - Vyhodnocení produkce odpadu - Příprava dat, jsme si připravili podklady pro reálnou úlohu o statistickém vyhodnocení dat produkce odpadu.
V tomto tutoriálu Data Miningu dokončíme naši reálnou úlohu, v níž zkoumáme data o produkci odpadů ve dvou rozdílných regionech. K řešení úlohy využijeme jazyk Python, který díky své knihovně Pandas umožňuje velmi snadnou aplikaci i pokročilých statistických metod. Pro vyhodnocení dat využijeme statistický ttest.
Příprava prostředí
Nejdříve zkontrolujeme, že máme Python nainstalovaný. Do terminálu vypíšeme:
python --version
Výstupem z konzole pak bude informace o aktuální verzi Pythonu:
Konzolová aplikace
Python 3.9.13
Instalace Pythonu a PyCharm
Pokud nemáme Python nainstalovaný (v konzoli se zobrazila chybová hláška), budeme postupovat podle návodu v lekci PyCharm a první konzolová aplikace v Pythonu. V lekci je kompletní návod pro instalaci vývojového prostředí (IDE), které si pak Python samo nainstaluje. Prostředí PyCharm je vhodné nainstalovat, i pokud už Python v systému máme. Jiné vhodné prostředí je například Visual Studio Code.
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit tento kurz
Před koupí tohoto článku je třeba koupit předchozí díl
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
V tomto tutoriálu budeme pokračovat v naší úloze. Provedeme statistické testování v Pythonu prostřednictvím knihoven Pandas a MatPlotLib.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.