NOVINKA - Online rekvalifikační kurz Java programátor. Oblíbená a studenty ověřená rekvalifikace - nyní i online.
NOVINKA – Víkendový online kurz Software tester, který tě posune dál. Zjisti, jak na to!

Lekce 18 - Deep Q-learning v Pythonu

V minulé lekci, Q-Learning v Pythonu, jsme si ukázali Q-Learning v Pythonu na příkladu MountainCar.

V minulých lekcích jsme vytvořili Q-learning algoritmus, který se zvládnul naučit MountainCar. I když to tak vypadat nemusí, v porovnání s jinými hrami se jednalo o velmi jednoduché prostředí, ve kterém nám stačilo znát jen dvě informace - rychlost a pozice agenta. V takovém jednoduchém případě nám opravdu stačí jednoduchá tabulka na udržení hodnot kvality jednotlivých akcích v daném stavu prost


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Koupit tento kurz

Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh za pouhých 675 Kč
Aktuální stav konta 0 Kč
Koupí tohoto balíčku získáš přístup ke všem 22 článkům (18 lekcí, 4 testy) tohoto kurzu.

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

Popis a tvorba vlastního DQN (Deep Q-Learning) algoritmu v Pythonu a jeho využití pro Cartpole prostředí v OpenAI Gym.

Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal Marek Bečvář
Avatar
Marek Bečvář
Aktivity