Lekce 18 - Deep Q-learning v Pythonu
V minulé lekci, Q-Learning v Pythonu, jsme si ukázali Q-Learning v Pythonu na příkladu MountainCar.
V minulých lekcích jsme vytvořili Q-learning algoritmus, který se zvládnul naučit MountainCar. I když to tak vypadat nemusí, v porovnání s jinými hrami se jednalo o velmi jednoduché prostředí, ve kterém nám stačilo znát jen dvě informace - rychlost a pozice agenta. V takovém jednoduchém případě nám opravdu stačí jednoduchá tabulka na udržení hodnot kvality jednotlivých akcích v daném stavu prost
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit pouze tento kurz
Získej okamžitý přístup ke kurzu bez
časového omezení.
675 Kč
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Přístup k jednotlivým lekcím dle způsobu pořízení.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
Popis a tvorba vlastního DQN (Deep Q-Learning) algoritmu v Pythonu a jeho využití pro Cartpole prostředí v OpenAI Gym.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.
