Lekce 18 - Deep Q-learning v Pythonu
V minulé lekci, Q-Learning v Pythonu, jsme si ukázali Q-Learning v Pythonu na příkladu MountainCar.
V minulých lekcích jsme vytvořili Q-learning algoritmus, který se zvládnul naučit MountainCar. I když to tak vypadat nemusí, v porovnání s jinými hrami se jednalo o velmi jednoduché prostředí, ve kterém nám stačilo znát jen dvě informace - rychlost a pozice agenta. V takovém jednoduchém případě nám opravdu stačí jednoduchá tabulka na udržení hodnot kvality jednotlivých akcích v daném stavu prost
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit tento kurz
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
Popis a tvorba vlastního DQN (Deep Q-Learning) algoritmu v Pythonu a jeho využití pro Cartpole prostředí v OpenAI Gym.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.