Lekce 3 - Seznámení s Power Query a úvod do čištění dat Nové
V minulé lekci, Import dat do nástroje Power BI, jsme se seznámili se základními způsoby importu dat do nástroje Power BI Desktop.
V tomto Power BI tutoriálu si vysvětlíme, proč je důležité data čistit a co všechno nám umožňuje nástroj Power Query. Seznámíme se také s jeho prostředím a základními prvky. To vše je nezbytný základ pro každého, kdo chce tvořit kvalitní a spolehlivé reporty v Power BI.
Editor Power Query a jeho prostředí
Nejprve si vysvětleme, proč je důležité data čistit a jaké konkrétní problémy se při tom v praxi řeší. Tento přehled nám pomůže pochopit, k čemu Power Query slouží a proč je jeho ovládání klíčové pro jakoukoli práci s daty.
Proč je důležité data čistit?
Práce s daty začíná mnohem dříve, než vytvoříme první vizualizaci. Bez úprav dat by výsledná analýza byla nespolehlivá a mohla by vést ke špatným závěrům. Důvody pro čištění dat mohou být různé, ale mezi nejčastější patří:
- Zajištění kvality dat – chybné nebo nekompletní hodnoty zkreslují výsledky.
- Konzistence – různé formáty (například u datumu) je třeba sjednotit, aby šla data spojovat.
- Odstranění duplicit – opakující se řádky mohou ovlivnit součty, počty nebo průměry.
- Zvýšení výkonu – menší a očištěná datová sada se načítá rychleji a lépe se s ní pracuje.
- Přehlednost a interpretovatelnost – dobře strukturovaná data se snáz čtou a vysvětlují ostatním.
Kdy data čistit?
Úprava a čištění dat není jednorázová akce – v reálných projektech se k ní vracíme opakovaně. Často zjistíme problémy až ve chvíli, kdy začneme tvořit reporty nebo kombinovat více datových zdrojů. Data čistíme:
- Při slučování z více zdrojů – tabulky mohou mít různé struktury, klíče nebo názvy sloupců.
- Před vizualizací nebo reportingem – aby se v grafech nezobrazovaly neplatné nebo zavádějící hodnoty.
- Při migraci do jiného systému – nový systém očekává přesně dané typy a formáty dat.
- Při automatizaci – chybná nebo chybějící data mohou způsobit selhání celého procesu.
- Při modelování a predikci – pro přesné výpočty a trénování modelů potřebujeme kvalitní vstupy.
Ukázkové scénáře z praxe
Aby bylo jasnější, jak vypadá čištění dat v konkrétních situacích, přidáváme několik příkladů. Některé z nich si později vyzkoušíme:
- Sloučení dat z více tabulek – spojení tabulky
objednavky
s tabulkouzakaznici
pomocí společného sloupceid_zakaznika
. - Odstranění chybějících hodnot – vynechání řádků, kde chybí například údaj o věku nebo pohlaví.
- Standardizace formátu dat – sjednocení různých
zápisů datumu, například
1.1.2023
a2023-01-01
. - Oprava chybných hodnot – odstranění nebo úprava
záporných čísel ve sloupci
mnozstvi
, kde dává smysl jen kladná hodnota. - Odstranění nevalidních údajů – vyfiltrování neplatných e-mailových adres nebo telefonních čísel se znaky, které do nich nepatří.
Power Query je nástroj, který tyto úpravy zvládne efektivně, přehledně a bez nutnosti programování.
Načtení tabulek do Power Query
V této lekci budeme navazovat na data, která jsme importovali dříve. Pokud ještě nemáme připravený soubor s daty, můžeme si ho stáhnout z přílohy na konci lekce nebo se vrátit k lekci Import dat do nástroje Power BI, kde je celý postup podrobně vysvětlen.
Při importu vybereme excelový sešit prodeje.xlsx
a z něj
všechny tabulky. Následně klikneme na možnost
Transformovat data. Tím se nám otevře editor Power Query, který si
nyní představíme.
Editor Power Query
Po načtení dat do Power Query se ocitneme v prostředí, které slouží pro vizuální úpravu tabulek. Nejde o jednoúčelový importní nástroj, ale o plnohodnotné prostředí pro datovou přípravu. Zde budeme většinu času upravovat strukturu a obsah dat ještě před jejich načtením do modelu Power BI.
Prostředí editoru Power Query vypadá následovně:

Popis panelů Power Query
Jak vidíme, Power Query se skládá z několika základních částí, které nám umožňují přehlednou a postupnou práci:
- Seznam dotazů (vlevo) – zde vidíme všechny tabulky,
které jsme načetli, a mezi kterými se můžeme přepínat. Aktuálně se
nacházíme v zobrazení tabulky
zakaznici
. - Náhled tabulky (uprostřed) – zobrazuje aktuální stav dat vybrané tabulky s jednotlivými sloupci (atributy) a řádky (záznamy). Tento náhled se průběžně aktualizuje při každé úpravě.
- Nastavení dotazů (vpravo) – každá úprava, kterou provedeme, se uloží jako samostatný krok v části Použitý postup. Tento seznam obsahuje všechny kroky transformace dat, které jsme dosud provedli. Každý krok můžeme zpětně upravit, přejmenovat nebo odstranit kliknutím na ikonu křížku vedle dané operace
- Pás karet (nahoře) – obsahuje jednotlivé funkce rozdělené do logických sekcí, které používáme k transformaci dat.
Přehled hlavních karet Power Query
Podobně jako v Excelu nebo Wordu pracujeme s kartami, které sdružují související nástroje. Zde je přehled těch nejdůležitějších:
- Soubor – nabídka pro uložení a načtení dotazů, přístup k možnostem datových připojení a nastavení Power Query.
- Domů – základní akce jako zavření a načtení dat, odstranění sloupců, filtrování, seskupení nebo sloučení dotazů.
- Transformace – nástroje pro změnu datových typů, nahrazení hodnot, rozdělení nebo sloučení sloupců, transpozici tabulek a další operace pro úpravu dat.
- Přidání sloupce – vytváření nových sloupců z výpočtů, podmínek nebo kombinací jiných polí.
- Zobrazení – nastavení náhledu a pracovního prostoru, zobrazení kroků transformace, datových typů a dalších náhledových prvků.
- Nástroje – pokročilé možnosti jako správce dotazů, sledování výkonu nebo přístup k editoru jazyka M.
- Nápověda – odkazy na oficiální dokumentaci, interaktivní návody, podporu a další užitečné zdroje.
Jazyk M
Power Query při provádění transformací automaticky generuje na pozadí každý náš krok jako zápis v jazyce M. Tento jazyk umožňuje hlubší úpravy dat pomocí vlastních skriptů. Každý krok je reprezentován konkrétním M kódem, který lze zobrazit a ručně upravit v Editoru pokročilých dotazů, pokud potřebujeme složitější operace nebo větší kontrolu nad procesem transformace.
Jazyk M vypadá následovně:

Nyní víme, proč je důležité data čistit, kdy se to v praxi nejčastěji řeší a jak s tím pomáhá Power Query. Seznámili jsme se s jeho prostředím, logikou práce a krátce si uvedli jazyk M, který zaznamenává každý krok úprav. Příště si ukážeme konkrétní transformace dat v praxi.
V další lekci, Základní úpravy a transformace dat v Power Query, se seznámíme se základními transformacemi v Power Query.
Měl jsi s čímkoli problém? Stáhni si vzorovou aplikaci níže a porovnej ji se svým projektem, chybu tak snadno najdeš.
Stáhnout
Stažením následujícího souboru souhlasíš s licenčními podmínkami
Staženo 3x (19.84 kB)
Aplikace je včetně zdrojových kódů