Lekce 1 - Úvod do Visual Basic .NET a .NET frameworku
Vítejte u první lekce on-line kurzu o Visual Basic .NET (zkráceně VB .NET), který vám odhalí tento jazyk i framework .NET. Budeme se učit postupně, od úplných začátků až po složité konstrukce, objektové modely a např. práci s databází. S trochou trpělivosti a vytrvalosti se z tebe tak stane dobrý programátor.
Abychom plně porozuměli jazyku VB.NET, ohlédněme se do minulosti na to, jak se programovací jazyky vyvíjely. Bude pro nás totiž důležité pochopit, jak VB.NET pracuje a proč je dobré programovat právě v něm.
Vývoj programovacích jazyků
1. generace jazyků - Strojový kód
Procesor počítače umí vykonávat jen omezené množství jednoduchých instrukcí, které jsou uloženy jako sekvence bitů, jsou to tedy čísla. Ta se mu obvykle zadávají v hexadecimální (šestnáctkové) soustavě. Instrukce jsou tak elementární, že umožňují pouze např. sčítání adres nebo skoky mezi instrukcemi. Nelze např. jednoduše sečíst dvě čísla, musíme se na čísla dívat jako na adresy v paměti a takové sečtení čísel zabere několik instrukcí. Program sčítající dvě čísla by vypadal např. takto:
2104 1105 3106 7001 0053 FFFE 0000
Instrukce se procesoru předloží v binární podobě. Takovýto kód je samozřejmě extrémně nečitelný a závisí na instrukční sadě daného CPU. Určitě v tomto jazyce nebude jednoduché tvořit nějaké programy, bohužel každý program musí být nakonec do tohoto jazyka přeložen, aby mohl být na procesoru počítače spuštěn.
2. generace jazyků - Assembler
Assembler (zkráceně ASM) není o nic jednodušší, než strojový kód, ale je lidsky čitelný. Jedná se o strojový kód, ve kterém mají instrukce slovní označení (kód), čili si člověk nemusí pamatovat čísla. Kódy instrukcí se poté přeloží na výše uvedený strojový kód. Stejný program by v ASM vypadal takto:
ORG 100 LDA A ADD B STA C HLT DEC 83 DEC –2 DEC 0 END
Vidíme, že je to poněkud lidštější, ale stále nezasvěcení lidé vůbec netuší, jak program funguje (včetně mne).
3. generace jazyků
Jazyky v třetí generaci konečně nabízí uživateli určitou abstrakci nad tím, jak program vidí počítač, zaměřují se na to, jak program vidí člověk. Naše čísla jsou vnímána již jako proměnné, zdrojový kód připomíná matematický zápis.
Sečtení dvou čísel by v jazyce C vypadalo takto:
int main(void) { int a, b, c; a = 83; b = -2; c = a + b; return 0; }
Všichni asi tušíme, co program dělá, sečte čísla 83
a
-2
a výsledek uloží do proměnné c
. U všech
jazyků třetí generace je samozřejmě výhodou vysoká čitelnost. S dalším
vývojem šly jazyky ještě dál a přinesly objektově orientované
programování, ale o tom až později. Jazyky v třetí generaci spadají v
zásadě do třech kategorií:
Kompilované jazyky
Kompilované (neřízené) jazyky mají tedy svůj zdrojový kód v jazyce, kterému lidé dobře rozumí. Tento zdrojový kód se samozřejmě musí přeložit do strojového kódu, aby ho bylo možné na procesoru spustit. Tento překlad zajišťuje překladač (kompiler), který přeloží najednou celý program do stroj. kódu.
Kompilace má tyto výhody:
- Rychlost - Jediné zbrždění spočívá v jednorázové kompilaci, přeložený program poté běží srovatelně rychle, jako kdyby byl napsán např. v ASM.
- Nepřístupnost zdroj. kódu - Program se šíří již zkompilovaný, není jej možné jednoduše modifikovat pokud zároveň nevlastníte jeho zdroj. kód.
- Snadné odhalení chyb ve zdroj. kódu - Pokud zdrojový kód obsahuje chybu, celý proces kompilace spadne a programátor je s chybou seznámen. To značně zjednodušuje vývoj.
Dále jsou tu samozřejmě nevýhody:
- Závislost na platformě - Program je stále závislý na platformě, tedy na typu procesoru a operačním systému. Zkompilovaný program nemůžeme vzít a přenést na jinou platformu bez toho, aby byl na této platformě zkompilován.
- Nemožnost editace - Jakmile se program jednou zkompiluje do zdrojového kódu, nelze ho editovat jinak, než opětovnou kompilací. To pochopitelně platí i pro výše zmíněné jazyky.
- Memory management - Vzhledem k tomu, že počítač danému programu nerozumí a jen mechanicky vykonává instrukce, můžeme se někdy setkat s velmi nepříjemnými chybami s přetečením paměti. Kompilované jazyky obvykle nemají automatickou správu paměti a jsou to jazyky nižší (s nižším komfortem pro programátora). Běhové chyby způsobené zejména špatnou správou paměti se kompilací neodhalí.
Příkladem kompilovaných jazyků jsou např. jazyk C, jeho objektový následník C++ nebo Pascal/Delphi.
Interpretované jazyky
Interpretace se snaží řešit problém přenositelnosti programů mezi různými platformami a také přichází s vyšším komfortem pro programátora. Interpret funguje podobně, jako kompiler, jen nepřekládá program celý najednou, ale překládá pouze to, co je v danou chvíli potřeba. (Interpreter znamená v angličtině tlumočník, tedy nejprve vyslechne jednu větu mluvčího a tu poté přeloží a vysloví. Překlad probíhá během proslovu, tedy běhu programu, po větách/instrukcích. Kompiler/překladač přeloží rozhovor celý najednou a poté ho celý přečte.). Můžeme si představit, že výše uvedený zdrojový kód by interpret četl po jednotlivých řádcích, tu část by vždy zkompiloval do strojového kódu a vykonal. Výsledek kompilace by zahodil a přesunul by se na další řádek. Možná vám to připadá jako plýtvání výkonem procesoru a je pravda, že tento způsob běhu programu také není zrovna nejrychlejší.
Jaké může mít tedy tento postup výhody? Je jich hned několik:
- Přenositelnost - Program je plně přenositelný, pokud existuje interpret pro danou platformu, půjde tam zdrojový kód programu spustit (a vývoj interpretu je snažší, než vývoj kompilátoru).
- Jednodušší vývoj - Ve vyšších jazycích jsme odstíněni od správy paměti, kterou za nás dělá tzv. garbage collector (řekneme si o něm v seriálu více). Často také nemusíme ani zadávat datové typy a máme k dispozici vysoce komfortní kolekce a další struktury.
- Stabilita - Díky tomu, že interpret kódu rozumí, předejde chybám, které by zkompilovaný program jinak klidně vykonal. Běh interpretovaných programů je tedy určitě bezpečnější, dále umožňuje zajímavou vlastnost, tzv. reflexi, kdy program za běhu zkoumá sám sebe, ale o tom později.
- Jednoduchá editace - Program můžeme vyvíjet po částech a nahrávat na cílové umístění, díky tomu, že se nemusí kompilovat, ho je možné jednoduše editovat "za běhu".
Interpret má tři zásadní nevýhody:
- Rychlost - Interpretace může být mnohdy velmi pomalá a program tak plně nevyužívá výkon počítače.
- Často obtížné hledání chyb - Díky kompilaci za běhu se chyby v kódu objeví až v tu chvíli, kdy je kód spuštěn. To může být někdy velmi nepříjemné.
- Zranitelnost - Protože se program šíří v podobě zdrojového kódu, každý do něj může zasahovat nebo krást jeho části.
Příkladem interpretovaného jazyka je např. PHP. Na většině webů ten poměrně pohodlný jazyk výkonově stačí, ale například Facebook používá speciální kompilovanou verzi PHP, zájemci ať se podívají na projekt HipHop for PHP.
Jazyky s virtuálním strojem
Napadlo vás, co by se stalo, kdyby se oba dva výše zmíněné způsoby spojily? Pokud ano, gratuluji, vynalezli jste virtuální stroj. Jedná se o nejmodernější podobu jazyka, která je v současné době také nejrozšířenější a nejlepší volbou pro vývoj většiny aplikací. Nebudu tajit, že do této kategorie spadá samotný VB.NET nebo C# a Java.
Zdrojový kód je nejprve přeložen do tzv. mezikódu, kterému Microsoft říká CIL (Common Intermediate Language). Jedná se v podstatě o strojový (binární) kód, který má ale o poznání jednodušší instrukční sadu a přímo podporuje objektové programování. Tento mezikód je potom díky jednoduchosti relativně rychle interpretovatelný tzv. virtuálním strojem (tedy interpretem, v případě .NET je to tzv. CLR - Common Language Runtime). Výsledkem je strojový kód pro náš procesor.
Určitě jste trochu vyděšeni, ale věřte, že jsme v podstatě odstranili nevýhody interpreta i kompileru a můžeme využívat mnohé z jejich výhod:
- Odhalení chyb ve zdrojovém kódu - Díky kompilaci do CIL jednoduše odhalíme chyby ve zdrojovém kódu.
- Stabilita - Díky tomu, že interpret kódu rozumí, zastaví nás před vykonáním nebezpečné operace a na chybu upozorní. Můžeme také provádět reflexi (i když pro CIL, ale od toho jsme většinou odstíněni).
- Jednoduchý vývoj - Máme k dispozici hitech datové struktury a knihovny, správu paměti za nás provádí garbage collector.
- Slušná rychlost - Rychlost se u virtuálního stroje pohybuje mezi interpretem a kompilerem. Virtuální stroj již výsledky své práce po použití nezahazuje, ale dokáže je cachovat, sám se tedy optimalizuje při četnějších výpočtech a může dosahovat až rychlosti kompileru (Just In time Compilator). Start programu bývá pomalejší, protože stroj překládá společně využívané knihovny.
- Málo zranitelný kód - Aplikace se šíří jako zdrojový kód v CIL, není tedy úplně jednoduše lidsky čitelný.
- Přenositelnost - Asi je jasné, že hotový program poběží na každém železe, na kterém se nachází virtuální stroj. To ale není vše, my jsme dokonce nezávislí i na samotném jazyce. Na jednom projektu může dělat více lidí, jeden v Visual Basic, druhý v C# a třetí v C++. Zdrojové kódy se poté vždy přeloží do CILu.
Jazyky s virtuálním strojem ctí objektově orientované programování a jedná se o současný vrchol vývoje v této oblasti. Existují i jazyky 4. a 5. generace, ale ty mají specifické použití a nebudeme se s nimi zde zatím zabývat.
.NET framework
Jak funguje Visual Basic .NET jsme si tedy vysvětlili, ještě si řekněme, co je přesně .NET framework. Rozumí se jím v zásadě čtyři věci: jazyk, Visual Studio, Virtuální stroj (CLR) a knihovny
Jazyk
Jak již jsem se zmínil, v .NET máme k dispozici několik jazyků, ve kterých můžeme vyvíjet. C# je z nich nejmodernější a nejrozšířenější, VB.NET je původní Visual Basic, přizpůsobený pro právě pro .NET.
Visual Studio
Visual Studio je IDE (Integrated Development Environment) je prostředí, ve kterém píšeme zdrojový kód a které nám také pomáhá s vývojem. VS je velmi uznávané i v řadách javistů, jedná se o moderní IDE, které je ve verzi Express poskytováno zdarma a to i pro komerční účely.
Virtuální stroj
CLR je virtuální stroj, který interpretuje CIL do instrukcí fyzického procesoru.
Knihovny
Knihovny jsou asi největší výhodou .NETu. Microsoft nám v podstatě dodává kompletní sadu knihoven, ve které máme předpřipravenou řadu struktur a komponent, např. pro práci s konzolí, databázemi, formulářovými prvky a podobně. Řešení jsou kvalitní a aktuální, jsou sdílené mezi jednotlivými jazyky. Jelikož MS je autorem i Windows, jejich komponenty hezky pasují a jsou pro jejich systém odladěné. Pro běh aplikací je potom nutné, aby na koncové stanici byla ta samá verze .NETu, ve které byla aplikace vyvinuta. Dobrá zpráva je, že Windows mají vždy nějaký .NET v sobě, Windows 7 jsou tuším s .NET 3.5. .NET má následující strukturu:
V .NET 2.0 vidíme samotný CLR (virtuální stroj) a základní knihovnu Base Class Library. Verze 3.0 přináší určité nové směry ve vývoji formulářových aplikací a procesů. Zajímavá pro nás bude zejména verze 3.5, která přinesla tzv. dotazovací jazyk LINQ, o něm si řekneme více později. Další verze umožňuje efektivně provozovat LINQ na vícejádrových procesorech. V roce 2012 pak ještě přibyla verze 4.5, ta např. zjednodušuje psaní asynchronních funkcí (o tom později).
Nyní víme, s čím to vlastně budeme pracovat.
V příští lekci, Visual Studio a první konzolová aplikace ve VB.NET, si ukážeme práci s Visual Studiem a vytvoříme si svůj první program.