Lekce 1 - Úvod do objektově orientovaného programování v Pythonu
Vítejte u prvního tutoriálu kurzu objektově orientovaného programování v Pythonu. Kurz Základní konstrukce jazyka Python již máme za sebou, minule jsme jej dokončili dílem Matematické funkce v Pythonu a knihovna math. V tomto kurzu se naučíme objektově programovat a hlavně objektově myslet. Je to něco trochu jiného, než jsme dělali doteď a samotný program už nebudeme chápat jako několik řádků příkazů, které interpret vykonává odshora dolů.
Objektově orientované programování (dále jen OOP) nevzniklo náhodou, ale je důsledkem vývoje, který k němu směřoval. Jedná se o moderní metodiku vývoje softwaru, kterou podporuje většina programovacích jazyků. Častou chybou je, že se lidé domnívají, že OOP se využívá pouze při psaní určitého druhu programů a jinak je na škodu. Opak je pravdou - OOP je filosofie, je to nový pohled na funkci programu a komunikaci mezi jeho jednotlivými částmi. Mělo by se používat vždy, ať už děláme malou utilitku nebo složitý databázový systém. OOP není jen technika nebo nějaká doporučená struktura programu, je to hlavně nový způsob myšlení, nový náhled na problémy a nová éra ve vývoji softwaru.
Nejprve se podíváme do historie, jak se programovalo dříve a jaké konkrétní problémy OOP řeší. Je to totiž důležité k pochopení, proč OOP vzniklo.
Evoluce metodik
Je velký rozdíl mezi tím, jak se programovalo před 40 lety a jak se programuje dnes. První počítače neoplývaly velkým výkonem a i jejich software nebyl nijak složitý. Vývoj hardwaru je však natolik rychlý, že se počet tranzistorů v mikroprocesorech každý rok zdvojnásobí (Moorův zákon). Bohužel se lidé nedokáží rozvíjet tak rychle jako hardware. Stále rychlejší počítače vyžadují stále složitější a složitější software (resp. lidé toho chtějí po počítačích stále více a více). Když se v jedné chvíli zjistilo, že okolo 90 % softwaru je vytvořeno se zpožděním, s dodatečnými náklady nebo selhalo úplně, hledaly se nové cesty, jak programy psát. Vystřídalo se tak několik přístupů, přesněji se jim říká paradigmata (chápejme jako směry myšlení). Pojďme si je popsat.
1. Strojový kód
Program ve strojovém kódu byl jen souborem instrukcí, kde jsme neměli žádnou možnost pojmenovávat proměnné nebo zadávat matematické výrazy. Zdrojový kód byl samozřejmě specifický pro daný hardware (procesor). Toto paradigma bylo brzy nahrazeno.
2. Nestrukturované paradigma
Nestrukturovaný přístup je podobný assemblerům, jedná se o soubor
instrukcí, který se vykonává odshora dolů. Zdrojový kód již nebyl
závislý na hardwaru a byl lépe čitelný pro člověka, přístup na nějakou
dobu umožnil vytvářet komplexnější programy. Bylo tu však stále mnoho
úskalí: Jediná možnost, jak udělat něco vícekrát nebo jak se v kódu
větvit, byl příkaz GOTO
. Příkaz GOTO
nám
umožňoval "skákat" na jednotlivá místa v programu. Místa byla dříve
specifikována číslem řádku zdrojového kódu, což je samozřejmě
nepraktické. Když do kódu vložíme nový řádek, čísla přestanou
souhlasit a celý kód je rozbitý. Později vznikla možnost definovat tzv.
"návěstí". Takto se obcházela např. absence cyklů. Takovýto způsob
psaní programů je samozřejmě velice nepřehledný a brzy přestal
postačovat pro vývoj složitějších programů.
Obrovské rozšíření počítačů za posledních několik dekád má na svědomí růst poptávky po softwaru a logicky také růst poptávky po programátorech. Jistě existují lidé, kteří dokáží bez chyby psát programy v ASM nebo jiných nízkých jazycích, ale kolik jich je? A kolik si asi za takovou nadlidskou práci účtují? Je třeba psát programy tak, aby i méně zkušení programátoři dokázali psát kvalitní programy a nepotřebovali k tvorbě jednoduché utilitky pět let praxe.
3. Strukturované programování
Strukturované programování je první paradigma, které se udrželo delší dobu a opravdu chvíli postačovalo pro vývoj nových programů. Programujeme v něm pomocí cyklů a větvení. To je v podstatě to, kam jsme se doteď dostali.
Program lze rozložit do funkcí, jak jsme si již ukázali v lekci Funkce a výjimky v Pythonu. U strukturovaného programování hovoříme o tzv. funkcionální dekompozici. Problém se rozloží na několik podproblémů a každý podproblém potom řeší určitá funkce s parametry. Nevýhodou je, že funkce umí jen jednu činnost. Když chceme něco jiného, musíme napsat novou. Neexistuje totiž způsob, jak vzít starý kód a jen trochu ho modifikovat. Musíme psát znovu a znovu a tím vznikají zbytečné náklady a chyby. Tuto nevýhodu lze částečně obejít pomocí parametrizace funkcí (počet parametrů poté ale rychle narůstá) nebo použitím globálních proměnných. S globálními daty však vzniká nové nebezpečí - funkce mají přístup k datům ostatních. To je začátek konce. Nikdy totiž neuhlídáme, aby někde nedošlo k přepsání globálních dat mezi funkcemi. Tím začne docházet k nekontrolovatelným problémům. Celý program se potom skládá z nezapouzdřených bloků kódu a špatně se udržuje. Každá úprava programu zvyšuje složitost a program potom nutně dojde do stavu, kdy náklady na přidávání nových funkcí vzrostou na tolik, že se jej již nevyplatí rozšiřovat. Zástupci tohoto přístupu jsou například jazyky C a Pascal.
Mezi strukturovaným programováním a objektově orientovaným programováním existoval ještě mezičlánek, tzv. modulární programování, které nám umožňuje zapouzdřit určitou funkcionalitu do modulů. Stále však neexistuje způsob, jak již napsaný kód modifikovat a znovu využít.
Někdy se uvádí, že se jednoduché programy mají psát neobjektově, tedy strukturovaně. Není to však pravda. Když opomineme fakt, že porušujeme filozofii OOP jako takovou, nikdy nemůžeme vědět, zda se tento program neuchytí a z malé utilitky se nestane něco vážnějšího. Potom opět nutně dospějeme do stavu, kdy program nebude možné dál rozšiřovat. Budeme ho buď muset zahodit nebo celý přepsat s pomocí OOP.
Neobjektovým metodám psaní kódu se pro jejich nepřehlednost přezdívá spaghetti code (protože špagety jsou zamotané).
Objektově orientovaný přístup
Jedná se o filozofii a způsob myšlení, designu a implementace, kde klademe důraz na znovupoužitelnost. Přístup nalézá inspiraci v průmyslové revoluci. Konkrétně ve vynálezu základních komponent, které lze dále využívat (např. když stavíme dům, nebudeme si pálit cihly a soustružit šroubky, prostě je již máme hotové).
Poskládání programu z komponent je výhodnější a levnější. Můžeme mu věřit, je otestovaný (o komponentách se ví, že fungují, jsou otestovány a udržovány). Pokud je někde chyba, stačí ji opravit na jednom místě. Jsme motivováni k psaní kódu přehledně a dobře, protože ho po nás používají druzí nebo my sami v dalších projektech. Přiznejme si, že člověk je od přírody líný a kdyby nevěděl, že se jeho kód bude znovu využívat, nesnažil by se ho psát kvalitně
Znalosti, které jsme se doteď naučili, samozřejmě budeme používat dál. Náš kód budeme pouze jinak strukturovat a to do komunikujících objektů.
Jak OOP funguje
V tomto paradigmatu se snažíme nasimulovat realitu tak, jak ji jsme zvyklí vnímat. Můžeme tedy říci, že se odpoutáváme od toho, jak program vidí počítač (stroj) a píšeme program spíše z pohledu programátora (člověka). Jako jsme kdysi nahradili assembler lidsky čitelnými matematickými zápisy, nyní jdeme ještě dál a nahradíme i ty. Jde tedy o určitou úroveň abstrakce nad programem. To má značné výhody už jen v tom, že je to pro nás přirozenější a přehlednější.
Základní jednotkou je objekt, který odpovídá nějakému objektu z reálného světa (např. objekt člověk nebo databáze).
Každý objekt má své atributy a metody.
Atributy
Atributy objektu jsou vlastnosti neboli data, která uchovává (např. u člověka jméno a věk, u databáze heslo). Jedná se o prosté proměnné, se kterými jsme již stokrát pracovali. Někdy o nich hovoříme jako o vnitřním stavu objektu.
Metody
Metody jsou schopnostmi, které umí objekt vykonávat. U
člověka by to mohly být metody: jdi_do_prace()
,
pozdrav()
nebo mrkni()
. U databáze pak třeba
pridej_zaznam()
nebo vyhledej()
. Metody mohou mít
parametry a mohou také vracet nějakou hodnotu. Velmi dobře je známe,
používali jsme např. metodu upper()
na objektu str
(řetězec). Řetězec je vlastně objekt, který reprezentuje v realitě
nějaký text. Můžeme si tedy jednoduše představit, že jednáme s
řetězcem textu, něco mu přikazujeme nebo na něm něco nastavujeme. Objekt
řetězec pak tedy obsahuje metody, které s ním umí pracovat (nahrazovat jeho
části, převádět na velká písmena apod.) a má také nějaké atributy,
např. length
, který značí jeho délku.
Ve starších jazycích metody nepatřily objektům, ale volně se nacházely
v modulech. Místo text.upper()
bychom tedy postaru psali
upper(text)
. Nevýhodou bylo samozřejmě zejména to, že metoda
upper()
tehdy nikam nepatřila. Nebyl způsob, jakým si vyvolat
seznam toho, co se s řetězcem dá dělat a v kódu je nepořádek. Navíc jsme
nemohli mít dvě metody se stejným názvem. V OOP ale můžeme mít
uzivatel.vymaz()
a clanek.vymaz()
. To je velmi
přehledné a jednoduché, zatímco ve strukturovaném programu bychom museli
psát: vymaz_uzivatele(uzivatel)
a
vymaz_clanek(clanek)
. Takovýchto hloupých metod bychom museli
mít někde rozházených tisíce. Pokud vám to připomíná jazyk PHP, bohužel máte pravdu. PHP je v tomto opravdu hrozné a to z
toho důvodu, že jeho návrh je starý. Sice se časem plně přeorientovalo na
objekty, ale jeho základy se již nezmění. Python je naštěstí jazyk
moderní a plně podporuje objektově orientované
paradigma.
V tomto článku si vysvětlíme jen úplné základy, tedy jak objekty vytvářet a jak zapouzdřit jejich vnitřní logiku. Dalším funkcím OOP (mluvíme tu zejména o dědičnosti) budou věnované až další lekce, aby toho nebylo najednou moc
Třída
S pojmem třída jsme se již také setkali. Chápali jsme ji jako soubor příkazů. Třída však umožňuje mnohem více. Třída je vzor, podle kterého se objekty vytváří. Definuje jejich vlastnosti a schopnosti.
Objekt, který se vytvoří podle třídy, se nazývá
instance. Instance mají stejné rozhraní
jako třída, podle které se vytváří, ale navzájem se liší svými daty
(atributy). Mějme například třídu Clovek
a od ní si vytvořme
instance karel
a josef
. Obě instance mají jistě ty
samé metody a atributy jako třída (např. jmeno
a
vek
) a metody (jdi_do_prace()
a
pozdrav()
), ale hodnoty v nich se liší (první instance má v
atributu jmeno
hodnotu Karel
a ve vek
22
, druhá Josef
a 45
).
Komunikace mezi objekty probíhá pomocí předávání zpráv, díky čemuž
je syntaxe přehledná. Zpráva obvykle vypadá takto:
prijemce.nazev_metody(parametry)
. Např.
karel.pozdrav(sousedka)
by mohl způsobit, že instance
karel
pozdraví instanci sousedka
.
OOP stojí na základních třech pilířích:
- Zapouzdření
- Dědičnost
- Polymorfismus
Vysvětleme si první z nich.
Zapouzdření
Zapouzdření umožňuje skrýt některé metody a atributy tak, aby zůstaly použitelné jen pro třídu zevnitř. Objekt si můžeme představit jako černou skřínku (anglicky blackbox), která má určité rozhraní (interface), přes které jí předáváme instrukce/data a ona je zpracovává.
Nevíme, jak to uvnitř funguje, ale víme, jak se navenek chová a používá. Nemůžeme tedy způsobit nějakou chybu, protože využíváme a vidíme jen to, co tvůrce třídy zpřístupnil.
Příkladem může být třída Clovek
, která bude mít atribut
datum_narozeni
a na jeho základě další atributy:
plnolety
a vek
. Kdyby někdo objektu zvenčí změnil
datum_narozeni
, přestaly by platit proměnné
plnolety
a vek
. Říkáme, že vnitřní stav objektu
by byl nekonzistentní. Toto se nám ve strukturovaném
programování může klidně stát. V OOP však objekt zapouzdříme. Atribut
datum_narozeni
označíme jako privátní a ten tím pádem nebude
zvenčí viditelný. Naopak ven vystavíme metodu
zmen_datum_narozeni()
, která dosadí nové datum narození do
proměnné datum_narozeni
a zároveň provede potřebný přepočet
věku a přehodnocení plnoletosti. Použití objektu je bezpečné a aplikace
stabilní.
Zapouzdření tedy donutí programátory používat objekt jen tím
správným způsobem. Rozhraní (interface) třídy rozdělí na
veřejně přístupné (public
) a její vnitřní strukturu
(private
).
V příští lekci, První objektová aplikace v Pythonu - Hello object world, si vytvoříme svůj první objektový program.