Lekce 19 - ChatGPT - Čištění a anonymizace dat Nové
V předchozí lekci, ChatGPT - Praktické využití pro analýzu dat, jsme si ukázali, jak pomocí ChatGPT generovat textové zprávy a třídit textové odpovědi.
V dnešní lekci se zaměříme na to, jak ChatGPT pomáhá s čištěním dat, konkrétně se sjednocením, kategorizací a opravou textových údajů. Ruční úprava dat bývá zdlouhavá. ChatGPT umožňuje rychle a bez programování odstranit nekonzistence, opravit překlepy a sjednotit výrazy. Stačí jasně zadat požadavek v přirozeném jazyce.
Sjednocení názvů
Uživatel zadal seznam názvů měst, které obsahují různé varianty zápisu (např. různé velikosti písmen, překlepy nebo doplňkové informace jako číslovky). Cílem bylo sjednotit tyto názvy do jednotného formátu tak, aby každé město bylo reprezentováno pouze jednou standardizovanou verzí (Praha, Brno, Ostrava). Funkčnost si prvně vyzkoušíme na jednoduchém příkladu, čištění větší tabulky dat si ukážeme na konci lekce:
Představme si, že máme data se stejnými názvy měst, ale v různých variantách a s chybami: Původní záznam Praha praha Praha 1 Brno brno BRNO Ostrava ostava (překlep) Sjednoť tyto názvy měst do jednotného tvaru (Praha, Brno, Ostrava)!
Výsledek:
...konec náhledu článku...
Pokračuj dál
Došel jsi až sem a to je super! Věříme, že ti první lekce ukázaly něco nového a užitečného.
Chceš v kurzu pokračovat? Přejdi do prémiové sekce.
Koupit tento kurz
Obsah článku spadá pod licenci Premium, koupí článku souhlasíš se smluvními podmínkami.
- Neomezený a trvalý přístup k jednotlivým lekcím.
- Kvalitní znalosti v oblasti IT.
- Dovednosti, které ti pomohou získat vysněnou a dobře placenou práci.
Popis článku
Požadovaný článek má následující obsah:
V tutoriálu si ukážeme, jak využít ChatGPT při čištění a přípravě dat - zejména při identifikaci kategorií, sjednocení výrazů a návrzích pravidel.
Kredity získáš, když podpoříš naši síť. To můžeš udělat buď zasláním symbolické částky na podporu provozu nebo přidáním obsahu na síť.