NOVINKA: Získej 40 hodin praktických dovedností s AI – ZDARMA ke každému akreditovanému kurzu!
Hledáme nové posily do ITnetwork týmu. Podívej se na volné pozice a přidej se do nejagilnější firmy na trhu - Více informací.

Lekce 3 - Seznámení s Power Query a úvod do čištění dat Nové

V minulé lekci, Import dat do nástroje Power BI, jsme se seznámili se základními způsoby importu dat do nástroje Power BI Desktop.

V tomto Power BI tutoriálu si vysvětlíme, proč je důležité data čistit a co všechno nám umožňuje nástroj Power Query. Seznámíme se také s jeho prostředím a základními prvky. To vše je nezbytný základ pro každého, kdo chce tvořit kvalitní a spolehlivé reporty v Power BI.

Editor Power Query a jeho prostředí

Nejprve si vysvětleme, proč je důležité data čistit a jaké konkrétní problémy se při tom v praxi řeší. Tento přehled nám pomůže pochopit, k čemu Power Query slouží a proč je jeho ovládání klíčové pro jakoukoli práci s daty.

Proč je důležité data čistit?

Práce s daty začíná mnohem dříve, než vytvoříme první vizualizaci. Bez úprav dat by výsledná analýza byla nespolehlivá a mohla by vést ke špatným závěrům. Důvody pro čištění dat mohou být různé, ale mezi nejčastější patří:

  • Zajištění kvality dat – chybné nebo nekompletní hodnoty zkreslují výsledky.
  • Konzistence – různé formáty (například u datumu) je třeba sjednotit, aby šla data spojovat.
  • Odstranění duplicit – opakující se řádky mohou ovlivnit součty, počty nebo průměry.
  • Zvýšení výkonu – menší a očištěná datová sada se načítá rychleji a lépe se s ní pracuje.
  • Přehlednost a interpretovatel­nost – dobře strukturovaná data se snáz čtou a vysvětlují ostatním.

Kdy data čistit?

Úprava a čištění dat není jednorázová akce – v reálných projektech se k ní vracíme opakovaně. Často zjistíme problémy až ve chvíli, kdy začneme tvořit reporty nebo kombinovat více datových zdrojů. Data čistíme:

  • Při slučování z více zdrojů – tabulky mohou mít různé struktury, klíče nebo názvy sloupců.
  • Před vizualizací nebo reportingem – aby se v grafech nezobrazovaly neplatné nebo zavádějící hodnoty.
  • Při migraci do jiného systému – nový systém očekává přesně dané typy a formáty dat.
  • Při automatizaci – chybná nebo chybějící data mohou způsobit selhání celého procesu.
  • Při modelování a predikci – pro přesné výpočty a trénování modelů potřebujeme kvalitní vstupy.

Ukázkové scénáře z praxe

Aby bylo jasnější, jak vypadá čištění dat v konkrétních situacích, přidáváme několik příkladů. Některé z nich si později vyzkoušíme:

  • Sloučení dat z více tabulek – spojení tabulky objednavky s tabulkou zakaznici pomocí společného sloupce id_zakaznika.
  • Odstranění chybějících hodnot – vynechání řádků, kde chybí například údaj o věku nebo pohlaví.
  • Standardizace formátu dat – sjednocení různých zápisů datumu, například 1.1.2023 a 2023-01-01.
  • Oprava chybných hodnot – odstranění nebo úprava záporných čísel ve sloupci mnozstvi, kde dává smysl jen kladná hodnota.
  • Odstranění nevalidních údajů – vyfiltrování neplatných e-mailových adres nebo telefonních čísel se znaky, které do nich nepatří.

Power Query je nástroj, který tyto úpravy zvládne efektivně, přehledně a bez nutnosti programování.

Načtení tabulek do Power Query

V této lekci budeme navazovat na data, která jsme importovali dříve. Pokud ještě nemáme připravený soubor s daty, můžeme si ho stáhnout z přílohy na konci lekce nebo se vrátit k lekci Import dat do nástroje Power BI, kde je celý postup podrobně vysvětlen.

Při importu vybereme excelový sešit prodeje.xlsx a z něj všechny tabulky. Následně klikneme na možnost Transformovat data. Tím se nám otevře editor Power Query, který si nyní představíme.

Editor Power Query

Po načtení dat do Power Query se ocitneme v prostředí, které slouží pro vizuální úpravu tabulek. Nejde o jednoúčelový importní nástroj, ale o plnohodnotné prostředí pro datovou přípravu. Zde budeme většinu času upravovat strukturu a obsah dat ještě před jejich načtením do modelu Power BI.

Prostředí editoru Power Query vypadá následovně:

Zobrazení editoru Power Query - Datová analýza s Power BI

Popis panelů Power Query

Jak vidíme, Power Query se skládá z několika základních částí, které nám umožňují přehlednou a postupnou práci:

  • Seznam dotazů (vlevo) – zde vidíme všechny tabulky, které jsme načetli, a mezi kterými se můžeme přepínat. Aktuálně se nacházíme v zobrazení tabulky zakaznici.
  • Náhled tabulky (uprostřed) – zobrazuje aktuální stav dat vybrané tabulky s jednotlivými sloupci (atributy) a řádky (záznamy). Tento náhled se průběžně aktualizuje při každé úpravě.
  • Nastavení dotazů (vpravo) – každá úprava, kterou provedeme, se uloží jako samostatný krok v části Použitý postup. Tento seznam obsahuje všechny kroky transformace dat, které jsme dosud provedli. Každý krok můžeme zpětně upravit, přejmenovat nebo odstranit kliknutím na ikonu křížku vedle dané operace
  • Pás karet (nahoře) – obsahuje jednotlivé funkce rozdělené do logických sekcí, které používáme k transformaci dat.

Přehled hlavních karet Power Query

Podobně jako v Excelu nebo Wordu pracujeme s kartami, které sdružují související nástroje. Zde je přehled těch nejdůležitějších:

  • Soubor – nabídka pro uložení a načtení dotazů, přístup k možnostem datových připojení a nastavení Power Query.
  • Domů – základní akce jako zavření a načtení dat, odstranění sloupců, filtrování, seskupení nebo sloučení dotazů.
  • Transformace – nástroje pro změnu datových typů, nahrazení hodnot, rozdělení nebo sloučení sloupců, transpozici tabulek a další operace pro úpravu dat.
  • Přidání sloupce – vytváření nových sloupců z výpočtů, podmínek nebo kombinací jiných polí.
  • Zobrazení – nastavení náhledu a pracovního prostoru, zobrazení kroků transformace, datových typů a dalších náhledových prvků.
  • Nástroje – pokročilé možnosti jako správce dotazů, sledování výkonu nebo přístup k editoru jazyka M.
  • Nápověda – odkazy na oficiální dokumentaci, interaktivní návody, podporu a další užitečné zdroje.
Jazyk M

Power Query při provádění transformací automaticky generuje na pozadí každý náš krok jako zápis v jazyce M. Tento jazyk umožňuje hlubší úpravy dat pomocí vlastních skriptů. Každý krok je reprezentován konkrétním M kódem, který lze zobrazit a ručně upravit v Editoru pokročilých dotazů, pokud potřebujeme složitější operace nebo větší kontrolu nad procesem transformace.

Jazyk M vypadá následovně:

Jazyk M - Datová analýza s Power BI

Nyní víme, proč je důležité data čistit, kdy se to v praxi nejčastěji řeší a jak s tím pomáhá Power Query. Seznámili jsme se s jeho prostředím, logikou práce a krátce si uvedli jazyk M, který zaznamenává každý krok úprav. Příště si ukážeme konkrétní transformace dat v praxi.

V další lekci, Základní úpravy a transformace dat v Power Query, se seznámíme se základními transformacemi v Power Query.


 

Měl jsi s čímkoli problém? Stáhni si vzorovou aplikaci níže a porovnej ji se svým projektem, chybu tak snadno najdeš.

Stáhnout

Stažením následujícího souboru souhlasíš s licenčními podmínkami

Staženo 3x (19.84 kB)
Aplikace je včetně zdrojových kódů

 

Jak se ti líbí článek?
Před uložením hodnocení, popiš prosím autorovi, co je špatněZnaků 0 z 50-500
Předchozí článek
Import dat do nástroje Power BI
Všechny články v sekci
Datová analýza s Power BI
Přeskočit článek
(nedoporučujeme)
Základní úpravy a transformace dat v Power Query
Článek pro vás napsal Adam Hamšík
Avatar
Uživatelské hodnocení:
4 hlasů
.
Aktivity