Lekce 16 - Reinforcement learning v Pythonu a OpenAI
V předchozím kvízu, Kvíz - Perceptrony v Pythonu, jsme si ověřili nabyté zkušenosti z předchozích lekcí.
Reinforcement learning je velmi zajímavá metoda strojového učení vedle metod pod dozorem a bez dozoru (supervised/unsupervised learning) a může být řečeno, že je někde napůl cesty mezi těmito dvěma.
Reinforcement learning
Při této metodě je agent odměňován za chtěné a trestán za nechtěné chování (snažíme se reinforcenout to, co od něj chceme). Takto je agent schopný dosahovat cíle, které mu zadáme.
Při tomto typu učení agent vnímá svoje prostředí a na základě těchto vstupů (vjemů) se rozhoduje o dalších akcích, které vykoná.
Využití
Obecně se tato metoda může použít například tehdy, když cíl našeho úkolu je možno dosáhnout pouze spojením nějakého množství různých komplexních akcí, které nejsme schopni
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit tento kurz
Před koupí tohoto článku je třeba koupit předchozí díl
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
Lekce zabývající se metodou strojového učení reinforcement learning. Zároveň stručná ukázka práce s OpenAI a příprava na řešení úkolů v prostředí Gym.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.