Lekce 6 - Textové řetězce v Pythonu

V minulé lekci, Typový systém podruhé - Datové typy v Pythonu, jsme si řekli více o datových typech v Pythonu.

V tomto Python tutoriálu se podíváme na textové řetězce. Naučíme se zjistit jejich délku, jak je sloučit, replikovat a mnoho dalšího.

Textové řetězce v Pythonu

Textové řetězce slouží k uchovávání textu. Jsou to v podstatě sekvence znaků obklopené buď jednoduchými ('text'), dvojitými ("text") nebo trojitými uvozovkami ('''text''' nebo """text"""). Díky této flexibilitě se naučíme snadno pracovat s různými textovými formáty, včetně řetězců obsahujících uvozovky. S řetězci lze provádět různé operace, jako je spojení, rozdělení, vyhledávání podřetězců či měnění velikosti písmen.

Vytváření řetězců

Už jsme si řekli, že řetězce se v Pythonu vytvářejí za pomoci jednoduchých, dvojitých nebo trojitých uvozovek.

Jednoduché a dvojité uvozovky

Nejjednodušší varianta je vytvoření řetězce pomocí jednoduchých nebo dvojitých uvozovek:

prazdny_retezec = ""
jiny_prazdny_retezec = ''
jazyk = "Python"
webova_stranka = 'ITnetwork.cz'

Kombinace jednoduchých a dvojitých uvozovek

Často potřebujeme v textu vypsat uvozovky. Abychom nemuseli znaky "escapovat", Python pro nás má řešení spočívající v kombinaci uvozovek:

zprava = 'Můj kamarád řekl: "Kdo používá Python, nikdy se nenudí!" A měl pravdu.'
print(zprava)

"Escapování" znaků znamená, že před speciálním znakem vložíme zpětné lomítko (\). Zpětné lomítko říká programovacímu jazyku, že následující znak má být interpretován doslova jako znak, a ne jako jeho speciální význam.

V konzoli uvidíme výstup:

Tvorba řetězců
Můj kamarád řekl: "Kdo používá Python, nikdy se nenudí!" A měl pravdu.

Na tom, zda budou vnější uvozovky jednoduché a vnitřní dvojité nezáleží :-)

Trojité uvozovky

Trojité uvozovky slouží k vytváření víceřádkových řetězců. I u jednoduchých a dvojitých lze k odřádkování použít sekvenci \n, ale u delších textů je to nepohodlné:

zprava = "Toto je víceřádkový řetězec vytvořený\npoužitím dvojitých uvozovek a znaku pro nový řádek."
viceradkova_zprava = '''Toto je také víceřádkový
řetězec, ale je vytvořený pomocí
trojitých dvojitých uvozovek.'''
print(zprava)
print(viceradkova_zprava)

V konzoli uvidíme výstup:

Tvorba řetězců
Toto je víceřádkový řetězec vytvořený
použitím dvojitých uvozovek a znaku pro nový řádek.
Toto je také víceřádkový
řetězec, ale je vytvořený pomocí
trojitých dvojitých uvozovek.

Řetězce z pohledu logiky

Pokud budeme chtít řetězec hodnotit z hlediska logiky, tak prázdný řetězec se vyhodnotí na bool hodnotu False a neprázdný na True:

prazdny_retezec = ""
jazyk = "Python"

print(bool(prazdny_retezec))
print(bool(jazyk))

Výstupem v konzoli je:

Tvorba řetězců
False
True

Speciální znaky

Občas potřebujeme trochu "speciální" text. Například v konzoli poskočit na další řádku, vytisknout uvozovky a podobně. Tyto speciální znaky zapisujeme uvnitř řetězců bez mezer pomocí tzv. escape sekvencí, které začínají zpětným lomítkem:

\n - nový řádek,
\t - tabulátor,
\a - zvonek (sekvecne pro pípnutí),
\\ - zpětné lomítko se píše jako \\ , protože jedním \ začínají speciální znaky,
\' - jednoduché uvozovky,
\" - dvojité uvozovky.

Ukažme si příklad:

print("Tento řetězec \npokračuje na novém řádku, odskočí \to jeden tabulátor vypíše zpětné lomítko: \\ a jednoduchou uvozovku: \'. Pak skončí.")

V konzoli uvidíme:

Tvorba řetězců
Tento řetězec
pokračuje na novém řádku, odskočí     o jeden tabulátor vypíše zpětné lomítko: \ a jednoduchou uvozovku: '. Pak skončí.

Operace s řetězci

S řetězci budeme provádět mnoho operací. Jak jsme si řekli už v úvodu lekce, můžeme např. určit jejich délku, sloučit je a replikovat. Pro práci s řetězci existuje mnoho funkcí a metod. Pojďme si ty nejdůležitější představit.

Zjištění délky řetězce

Délku řetězce zjistíme pomocí funkce len():

print(len("a"))
print(len("Python"))

V konzoli uvidíme:

Tvorba řetězců:
1
6

Slučování řetězců

Slučování je spojení více řetězců do jednoho. Něco na způsob sčítání čísel. Jako operátor použijeme znaménko +:

jazyk = "Python"
zprava = "je nejlepší!"
print(jazyk + zprava)

V konzoli uvidíme:

Tvorba řetězců:
Python je nejlepší!

Replikace

Replikace je "množení" řetězců. Zadaný řetězec se n-krát zopakuje, stačí ho "vynásobit" číslem. My zkusíme řetězec Bum! replikovat číslem 7:

retezec = "Bum! "
print(retezec * 7)

V konzoli uvidíme:

Replikace řetězců:
Bum! Bum! Bum! Bum! Bum! Bum! Bum!

Metody `startswith()`, `endswith()` a klíčové slovo `in`

Můžeme se jednoduše zeptat, zda řetězec začíná, končí nebo zda obsahuje určitý podřetězec (substring). Podřetězcem myslíme část původního řetězce. Všechny tyto metody budou jako parametr brát samozřejmě podřetězec a vracet hodnoty typu boolean (True/False). Zatím na výstup neumíme reagovat, ale pojďme si ho alespoň vypsat:

vstup = "Krokonosohroch"
print(vstup.startswith("krok"))
print(vstup.endswith("hroch"))
print("nos" in vstup)
print("roh" in vstup)

V konzoli uvidíme:

Metody řetězců:
False
True
True
False

Metody `upper()` a `lower()`

Rozlišování velkých a malých písmen může být někdy na obtíž. Mnohdy se budeme potřebovat zeptat na přítomnost podřetězce tak, aby nezáleželo na velikosti písmen. Situaci můžeme vyřešit pomocí metod upper() a lower(), které vrací řetězec ve velkých a v malých písmenech. Uveďme si reálnější příklad než je Krokonosohroch. Budeme mít v proměnné řádek konfiguračního souboru, který psal uživatel. Jelikož se na vstupy od uživatelů nelze spolehnout, musíme se snažit eliminovat možné chyby, zde např. s velkými písmeny:

nastaveni = "Fullscreen shaDows autosave"
nastaveni = nastaveni.lower()

print("Poběží hra ve fullscreenu?")
print("fullscreen" in nastaveni)

print("Budou zapnuté stíny?")
print("shadows" in nastaveni)

print("Přeje si hráč vypnout zvuk?")
print("nosound" in nastaveni)

print("Přeje si hráč hru automaticky ukládat?")
print("autosave" in nastaveni)

V konzoli uvidíme:

Metody řetězců:
Poběží hra ve fullscreenu?
True
Budou zapnuté stíny?
True
Přeje si hráč vypnout zvuk?
False
Přeje si hráč hru automaticky ukládat?
True

Vidíme, že jsme schopni zjistit přítomnost jednotlivých slov v řetězci tak, že si nejprve řetězec převedeme celý na malá písmena (nebo na velká) a potom kontrolujeme přítomnost slova jen malými (nebo velkými) písmeny. Takhle by mimochodem mohlo opravdu vypadat jednoduché zpracování nějakého konfiguračního skriptu.

Metoda `strip()`

Další nástrahou mohou být mezery a obecně všechny tzv. bílé znaky, které nejsou vidět, ale mohou nám uškodit. Obecně může být dobré trimovat všechny vstupy od uživatele. Zkusme si v následující aplikaci před číslo a za číslo zadat několik mezer, strip() je odstraní. Odstraňují se vždy bílé znaky kolem řetězce, nikoli uvnitř:

print("Zadejte číslo:")
vstup = input()
print("Zadal jste text: " + vstup)
print("Text po funkci strip: " + vstup.strip())

cislo = int(vstup.strip())
print("Převedl jsem zadaný text na číslo parsováním, zadal jste: " + str(cislo))

V konzoli uvidíme:

Metody řetězců:
Zadejte číslo:  5
Zadal jste text:   5
Text po funkci strip: 5
Převedl jsem zadaný text na číslo parsováním, zadal jste: 5

Pokud potřebujeme odstranit bílé znaky pouze na začátku nebo na konci řetězce, použijeme odvozené metody lstrip() a rstrip().

Metoda `replace()`

Asi nejdůležitější metodou pro datový typ str v Pythonu je nahrazení určité části řetězce jiným textem. Jako parametry metody replace() zadáme dva podřetězce: první je ten, který chceme nahrazovat, a druhý je tím, kterým chceme nahradit. Metoda vrátí nový řetězec, ve kterém proběhlo nahrazení. Pokud daný podřetězec metoda replace() nenajde, vrátí původní řetězec. Zkusme si to:

veta = "C# je nejlepší!"
veta = veta.replace("C#", "Python")
print(veta)

V konzoli uvidíme:

Metody řetězců:
Python je nejlepší!

Je toho ještě spoustu k vysvětlování a jsou další funkce metody, které jsme zatím neprobrali. K řetězcům se ještě vrátíme později v kurzu ;-)

V následujícím cvičení, Řešené úlohy k 5.-6. lekci Pythonu, si procvičíme nabyté zkušenosti z předchozích lekcí.

Článek pro vás napsal gcx11

Uživatelské hodnocení:

852 hlasů

(^_^)

Aktivity

Lekce 6 - Textové řetězce v Pythonu

Textové řetězce v Pythonu

Vytváření řetězců

Jednoduché a dvojité uvozovky

Kombinace jednoduchých a dvojitých uvozovek

Trojité uvozovky

Řetězce z pohledu logiky

Speciální znaky

Operace s řetězci

Zjištění délky řetězce

Slučování řetězců

Replikace

Metody startswith(), endswith() a klíčové slovo in

Metody upper() a lower()

Metoda strip()

Metoda replace()

Metody `startswith()`, `endswith()` a klíčové slovo `in`

Metody `upper()` a `lower()`

Metoda `strip()`

Metoda `replace()`