Lekce 7 - MS-SQL krok za krokem: Řazení, Limit a agregační funkce

V předešlém cvičení, Řešené úlohy k 6. lekci MS-SQL, jsme si procvičili nabyté zkušenosti z předchozích lekcí.

Dnes se v MS-SQL tutoriálu podívejme na řazení a agregační funkce.

Řazení

Doposud jsme nijak neřešili pořadí nalezených položek, které nám dotaz SELECT vrátil. Pořadí položek však není bez explicitního určení zaručeno. Většina databází neudržuje žádné stabilní pořadí položek a vrací je tak, jak se jim to zrovna hodí. MS-SQL není výjimkou a výsledky nevrací vždy seřazené podle Id, jak by se mohlo zdát. Databáze nám ale navrácený výsledek samozřejmě seřadit dokáže, když si o to řekneme.

Řadit můžeme podle kteréhokoli sloupce. Když budeme řadit podle našeho (číselného) Id s nastavenou Identity Specification, máme položky v pořadí, v jakém byly do databáze vloženy. Dále můžeme řadit podle číselných sloupců, ale i podle těch textových (řadí se podle abecedy). Řadit můžeme i podle datumu a všech dalších datových typů, databáze si s tím vždy nějak poradí.

Pojďme si vybrat úplně všechny uživatele a seřaďme je podle příjmení. Slouží k tomu klauzule ORDER BY (řadit podle), která se píše na konec dotazu:

SELECT [Jmeno], [Prijmeni] FROM [Uzivatele] ORDER BY [Prijmeni];

Výsledek:

Jmeno	Prijmeni
Václav	Blažek
Ondřej	Bohatý
Marie	Černá
Petr	Černý
Vítezslav	Churý
Pavel	Dušín
...	...

V dotazu by samozřejmě mohlo být i WHERE (psalo by se před ORDER BY), pro jednoduchost jsme vybrali všechny uživatele.

Řazení podle více sloupců

Řadit můžeme podle několika kritérií (sloupců). Pojďme si uživatele seřadit podle napsaných článků a ty se stejným počtem řaďme ještě podle abecedy:

SELECT [Jmeno], [Prijmeni], [PocetClanku]
FROM [Uzivatele]
ORDER BY [PocetClanku], [Prijmeni];

Výsledek:

Jmeno	Prijmeni	PocetClanku
Matěj	Horák	0
Michal	Krejčí	0
Petr	Černý	1
Miroslav	Kučera	1
Vladimír	Pokorný	1
Jana	Veselá	1
František	Veselý	1
Ludmila	Dvořáková	2
Věra	Svobodová	2
Jiří	Veselý	2
...	...	...

Směr řazení

Určit můžeme samozřejmě i směr řazení. Můžeme řadit vzestupně (výchozí směr) klíčovým slovem ASC a sestupně klíčovým slovem DESC. Zkusme si udělat žebříček uživatelů podle počtu článků. Ti první jich tedy mají nejvíce, řadit budeme sestupně. Ty se stejným počtem článků budeme řadit ještě podle abecedy:

SELECT [Jmeno], [Prijmeni], [PocetClanku]
FROM [Uzivatele]
ORDER BY [PocetClanku] DESC, [Prijmeni];

Výsledek:

Jmeno	Prijmeni	PocetClanku
Petr	Dvořák	18
Jan	Novák	17
Eva	Kučerová	12
Tomáš	Marný	12
Pavel	Dušín	9
Otakar	Kovář	9
...	...	...

DESC je třeba vždy uvést, vidíme, že řazení podle příjmení je normálně vzestupné, protože jsme DESC napsali jen k PocetClanku.

Limit

Zůstaňme ještě u našeho žebříčku uživatelů podle počtu článků. Takto budeme chtít vypsat pět nejlepších uživatelů. Když jich bude ale milion, asi není dobrý nápad je všechny vybrat a pak jich v aplikaci použít jen pět a těch 999 995 zahodit. Dáme databázi limit, tedy maximální počet záznamů, které chceme vybrat. Zároveň uvedeme i řazení.

S limitováním počtu záznamů jsme se již setkali v podobě klíčového slova TOP, které uvádíme s požadovaným počtem hned za klíčovým slovem SELECT. Zkusme si to:

SELECT TOP 5 [Jmeno], [Prijmeni], [PocetClanku]
FROM [Uzivatele]
ORDER BY [PocetClanku] DESC, [Prijmeni];

Výsledek:

Jmeno	Prijmeni	PocetClanku
Petr	Dvořák	18
Jan	Novák	17
Eva	Kučerová	12
Tomáš	Marný	12
Pavel	Dušín	9

TOP lze použít i bez toho, aniž bychom záznamy seřadili pomocí klauzule ORDER BY. Pak ale není zaručeno pořadí záznamů a nemůžeme se spolehnout na to, že nám příkaz SELECT bude vždy vracet stejný výsledek.

Přeskočení záznamů

Co kdybychom ale chtěli naopak prvních pět uživatelů žebříčku přeskočit a vybrat třeba jen následující tři? V tom případě bychom použili klauzule OFFSET a FETCH, které uvádíme na konec dotazu:

SELECT [Jmeno], [Prijmeni], [PocetClanku]
FROM [Uzivatele]
ORDER BY [PocetClanku] DESC, [Prijmeni]
OFFSET 5 ROWS
FETCH NEXT 3 ROWS ONLY;

Říkáme, že chceme "odsadit prvních pět řádků a načíst pouze tři následující". Výsledek:

Jmeno	Prijmeni	PocetClanku
Otakar	Kovář	9
Jaroslav	Novotný	8
Pavel	Procházka	8

Kdybychom chtěli pouze přeskočit prvních 5 záznamů a získat všechny následující, klauzuli FETCH bychom vynechali.

Klauzule OFFSET a FETCH lze použít pouze při současném seřazení záznamů pomocí klauzule ORDER BY.

Agregační funkce

Databáze nám nabízí spoustu tzv. agregačních funkcí. To jsou funkce, které nějakým způsobem zpracují více hodnot a jako výsledek vrátí hodnotu jednu.

Funkce `COUNT()`

Příkladem takové funkce je funkce COUNT(), která vrátí počet řádků v tabulce, splňující nějaká kritéria. Spočítejme, kolik z uživatelů napsalo alespoň jeden článek:

SELECT COUNT(*) FROM [Uzivatele] WHERE [PocetClanku] > 0;

Výsledek:

Na COUNT() se ptáme pomocí SELECT, není to příkaz, je to funkce, která se vykoná nad řádky a její výsledek je vrácen příkazem SELECT. Funkce má stejně jako v jiných programovacích jazycích (alespoň ve většině z nich) závorky. Ta hvězdička v nich znamená, že nás zajímají všechny sloupce. Můžeme totiž počítat třeba jen uživatele, kteří mají vyplněné jméno (přesněji kteří ho nemají NULL, ale to nechme na další lekce).

Nesprávné alternativní řešení

Určitě by vás napadl i jiný způsob, jak tohoto výsledku docílit. Jednoduše byste si vybrali nějakou hodnotu jako doposud (třeba jméno), tyto řádky byste si přenesli do své aplikace a spočítali, kolik jmen je. Data byste poté zahodili. Takový přenos je ale zbytečně náročný na databázi a zpomaloval by aplikaci. COUNT() přenáší jen jedno jediné číslo.

Nikdy nepočítejte pomocí výběru hodnoty, pouze pomocí funkce COUNT()!

Funkce `AVG()`

Funkce AVG() počítá průměr z daných hodnot. Podívejme se, jaký je průměrný počet článků na uživatele:

SELECT AVG([PocetClanku]) FROM [Uzivatele];

Výsledek:

Funkce `SUM()`

Funkce SUM() vrací součet hodnot. Podívejme se, kolik článků napsali dohromady lidé narození po roce 1980:

SELECT SUM([PocetClanku]) FROM [Uzivatele] WHERE [DatumNarozeni] > '1980-12-31';

Výsledek:

Funkce `MIN()`

Funkce MIN() vrátí minimum (nejmenší hodnotu). Najděme nejnižší datum narození:

SELECT MIN([DatumNarozeni]) FROM [Uzivatele];

Výsledek:

1935-05-15

Pozor, pokud bychom chtěli vybrat i jméno a příjmení, tento kód nebude fungovat:

-- Tento kód nebude fungovat
SELECT [Jmeno], [Prijmeni], MIN([DatumNarozeni]) FROM [Uzivatele];

Agregační funkce pracuje s hodnotami více sloupců a vybrané sloupce (Jmeno a Prijmeni) nebudou nijak souviset s hodnotou MIN(). Problém bychom mohli vyřešit poddotazem nebo ještě jednodušeji se funkcím MIN() a MAX() úplně vyhnout a použít místo nich řazení a TOP:

SELECT TOP 1 [Jmeno], [DatumNarozeni] FROM [Uzivatele] ORDER BY [DatumNarozeni];

Výsledek:

Jmeno	DatumNarozeni
Alfons	1935-05-15

Funkce `MAX()`

Obdobně jako MIN() existuje i funkce MAX(). Najděme maximální počet článků od 1 uživatele:

SELECT MAX([PocetClanku]) FROM [Uzivatele];

Výsledek:

MS-SQL má ještě nějaké agregační funkce, ale ty pro nás již nejsou zajímavé.

Seskupování (Grouping)

Položky v databázi můžeme seskupovat podle určitých kritérii. Seskupování používáme téměř vždy spolu s agregačními funkcemi. Pojďme seskupit uživatele podle jména:

SELECT [Jmeno] FROM [Uzivatele] GROUP BY [Jmeno];

Výsledek:

Jmeno
Alfons
Eva
František
Jan
Jana
...

Vidíme, že každé jméno je zde zastoupeno jen jednou, i když je v databázi vícekrát. Přidejme nyní kromě jména i počet jeho zastoupení v tabulce, uděláme to pomocí agregační funkce COUNT(*):

SELECT [Jmeno], COUNT(*) FROM [Uzivatele] GROUP BY [Jmeno];

Výsledek:

Jmeno
Alfons	1
Eva	1
František	1
Jan	2
Jana	1
...

Vidíme, že třeba Jany máme v databázi dva.

Seskupování podle více sloupců

Seskupovat můžeme i podle více sloupců. Kdybychom chtěli uživatele seskupit nejen podle jména, ale i podle příjmení, dotaz by vypadal následovně:

SELECT [Jmeno], [Prijmeni], COUNT(*) FROM [Uzivatele] GROUP BY [Jmeno], [Prijmeni];

Všechny požadované sloupce jsme oddělené čárkami uvedli v klauzuli GROUP BY. Do stejné skupiny tak budou zařazeni všichni uživatelé se shodnou kombinací hodnot v uvedených sloupcích.

Při použití seskupování lze příkazem SELECT vybrat pouze sloupce uvedené v klauzuli GROUP BY a sloupce, které vzniknou pomocí agregační funkce.

Klauzule `AS`

Pro zjednodušení si můžeme v dotazu vytvořit aliasy, tedy přejmenovat třeba nějaký dlouhý sloupec, aby byl dotaz přehlednější. S tímto se ještě setkáme u dotazů přes více tabulek, kde je to velmi užitečné. U tabulek AS používáme ke zjednodušení operací uvnitř dotazu. U sloupců se AS používá k tomu, aby aplikace viděla data pod jiným názvem, než jsou skutečně v databázi. To může být užitečné zejména u agregačních funkcí, protože pro ně v databázi není žádný sloupec a mohlo by se nám s jejich výsledkem špatně pracovat.

Upravme si předposlední dotaz a přejmenujme si sloupec s agregovaným počtem uživatelů na Pocet:

SELECT [Jmeno], COUNT(*) AS [Pocet] FROM [Uzivatele] GROUP BY [Jmeno];

Výsledek:

Použití AS u agregační funkce COUNT v MS-SQL databázi - MS-SQL databáze krok za krokem

V následujícím cvičení, Řešené úlohy k 7. lekci MS-SQL, si procvičíme nabyté zkušenosti z předchozích lekcí.

Článek pro vás napsal Michal Žůrek - misaz

Uživatelské hodnocení:

481 hlasů

Autor se věnuje tvorbě aplikací pro počítače, mobilní telefony, mikroprocesory a tvorbě webových stránek a webových aplikací. Nejraději programuje ve Visual Basicu a TypeScript. Ovládá HTML, CSS, JavaScript, TypeScript, C# a Visual Basic.

Aktivity

Nejčastěji vyhledáváné

Lekce 7 - MS-SQL krok za krokem: Řazení, Limit a agregační funkce

Řazení

Řazení podle více sloupců

Směr řazení

Limit

Přeskočení záznamů

Agregační funkce

Funkce COUNT()

Nesprávné alternativní řešení

Funkce AVG()

Funkce SUM()

Funkce MIN()

Funkce MAX()

Seskupování (Grouping)

Seskupování podle více sloupců

Klauzule AS

Funkce `COUNT()`

Funkce `AVG()`

Funkce `SUM()`

Funkce `MIN()`

Funkce `MAX()`

Klauzule `AS`