NOVINKA - Online rekvalifikační kurz Java programátor. Oblíbená a studenty ověřená rekvalifikace - nyní i online.
NOVINKA – Víkendový online kurz Software tester, který tě posune dál. Zjisti, jak na to!

Lekce 16 - Reinforcement learning v Pythonu a OpenAI

V předchozím kvízu, Kvíz - Perceptrony v Pythonu, jsme si ověřili nabyté zkušenosti z předchozích lekcí.

Reinforcement learning je velmi zajímavá metoda strojového učení vedle metod pod dozorem a bez dozoru (supervised/un­supervised learning) a může být řečeno, že je někde napůl cesty mezi těmito dvěma.

Reinforcement learning

Při této metodě je agent odměňován za chtěné a trestán za nechtěné chování (snažíme se reinforcenout to, co od něj chceme). Takto je agent schopný dosahovat cíle, které mu zadáme.

Při tomto typu učení agent vnímá svoje prostředí a na základě těchto vstupů (vjemů) se rozhoduje o dalších akcích, které vykoná.

Využití

Obecně se tato metoda může použít například tehdy, když cíl našeho úkolu je možno dosáhnout pouze spojením nějakého množství různých komplexních akcí, které nejsme schopni


 

...konec náhledu článku...
Pokračuj dál

Znalosti v hodnotě stovek tisíc získáš za pár korun

Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.

Koupit tento kurz

Koupit všechny aktuálně dostupné lekce s funkcí odevzdávání úloh za pouhých 675 Kč
Aktuální stav konta 0 Kč
Koupí tohoto balíčku získáš přístup ke všem 22 článkům (18 lekcí, 4 testy) tohoto kurzu.

Před koupí tohoto článku je třeba koupit předchozí díl

Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.

Co od nás v dalších lekcích dostaneš?
  • Neomezený a trvalý přístup k jednotlivým lekcím.
  • Kvalitní znalosti v oblasti IT.
  • Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.

Popis článku

Požadovaný článek má následující obsah:

Lekce zabývající se metodou strojového učení reinforcement learning. Zároveň stručná ukázka práce s OpenAI a příprava na řešení úkolů v prostředí Gym.

Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.

Článek pro vás napsal Marek Bečvář
Avatar
Marek Bečvář
Aktivity