Zimní výprodej Kotlin týden
Pouze tento týden sleva až 80 % na e-learning týkající se Kotlin
40 % bodů zdarma díky naší Zimní akci!

Lekce 4 - SEO - Optimalizace struktury webu

V minulém dílu našeho seriálu o SEO jsme probrali další algoritmy Google, téma penalizace a také jak správně vytvářet zpětné odkazy. Následující část seriálu je věnována tomu, jak navrhnout web, aby byl pro vyhledávače co nejoptimálnější.

Hezké URL adresy

Než se vyhledávač vůbec dostane na naši webovou stránku, projde přes URL adresu. Představte si, že vypadá nějak takto:

http://www.totojemujweb.cz/clanek.php?id=1234b=11

Vyhledávač z toho nebude příliš moudrý a navíc ho zmate větší množství parametrů. Přicházíme také o skvělou příležitost podstrčit mu klíčová slova. Vyhledávače totiž přisuzují relevanci mimo jiné i podle nejlepší shody klíčových slov a ta čerpají i z URL adresy. Hezké URL adresy (Pretty URL) se skládají jen ze slov a jsou důležitou součástí SEO. Slova jsou oddělena pomlčkami. V adresách se vyhněte používání velkých písmen, mezer, diakritice a zkrátka všemu, co by mohlo znepříjemnit jejich opisování nebo zpracování. Již příliš nezáleží na tom, zda adresa odpovídá skutečnému umístění dokumentu:

http://www.hardwareshop.cz/notebooky/notebook-lenovo-abc-123.html

Nebo slouží jen jako text, podle kterého se vybírá dokument z databáze:

http://www.hardwareshop.cz/notebooky/detail/notebook-lenovo-abc-123

Pozn.: Doména hardwareshop.cz je zvolena čistě náhodně.

Můžete se pro ilustraci také podívat na URL tohoto článku :) Hezké URL adresy jsou přínosné i pro lidi. Ono vůbec většinou platí, že když uděláme něco pro lidi, bude se to líbit i vyhledávačům. URL adresa je mimo jiné vidět i na SERP (stránce s výsledky vyhledávání).

Tento výukový obsah pomáhají rozvíjet následující firmy, které dost možná hledají právě tebe!

Každý dokument by měl být na webu přístupný jen pod jednou URL adresou. Měla by fungovat jak verze adresy s www., tak i bez www. Verze bez www. by měla odkazovat na verzi s www. a to pomocí přesměrování 301, aby to vyhledávače nechápali jako novou URL adresu. Stejně tak by na stejný článek neměly odkazovat různé subdomény. Pokud chcete z nějakého důvodu odkazovat na jeden článek pomocí více URL adres, uveďte u odkazu atribut rel="canonical".

Dostupnost

Web by se měl rychle načítat a být tedy dostupný. Doba generování stránky na straně serveru se obvykle pohybuje kolem 100ms, říká se, že do 500ms je to ještě snesitelné, i když už nepohodlné. Kromě doby generování je důležitá i celková doba načítání stránky (měla by být asi do 3 vteřin). Tu vám změří např. Chrome ve vývojářské konzoli (F12) nebo nástroj Google Analytics, o kterém si řekneme příště. Obecně platí, že čím je web rychlejší, tím více má přístupů. Pokud budete šetřit za webhosting, přijdete o řádově vyšší částky na ztrátách kvůli výpadkům nebo nižší aktivitě uživatelů. Je dokázáno, že na pomalých webech uživatelé zobrazí menší množství stránek a to i když se doba načítání zvýší např. jen o několik set ms. Výpadky nebo pomalé načítání stránek samozřejmě znemožňuje naše stránky používat jak lidem, tak i robotům. Mohou nastat i problémy s indexováním.

Validita

Náš web by měl být ideálně validní podle W3C specifikace. Prakticky je pro to nutné vynaložit poměrně velké úsilí a to hlavně kvůli různým editorům článků a podobně. Validátor nemusí váš web označit jako 100% validní, přiznejme si, že tyto weby jsou většinou umělé a ne příliš přínosné. Na živém webu nám vždy něco ujede a v dnešní době je zbytečné řešit každou podstránku. Základní kostra stránky by však měla být stoprocentní, neměli byste zapomínat na doctype, znakovou sadu, správnou definici hlavičky, oddělování JavaScriptu a CSS kódu do samostatných souborů a podobně.

Mapa stránek

Každý web by měl poskytovat mapu všech svých podstránek. Jedná se o XML dokument, který můžeme v případě malého počtu stránek napsat sami. Můžeme si ho nechat vygenerovat pomocí generátoru sitemap. Nebo si ho můžeme vytvořit velmi jednoduše pomocí PHP. Na názvu ani umístění souboru nezáleží, robotům o něm řekneme pomocí souboru robots.txt, o kterém si však povíme až v dalších dílech, nebo pomocí nástroje Google Analytics, jehož představení nás rovněž teprve čeká. Soubor sitemap.xml může v úplně nejjednodušší podobě vypadat např. takto:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
        <url>
                <loc>http://www.hardwareshop.cz/notebooky-a-ultrabooky.html</loc>
        </url>
        <url>
                <loc>http://www.hardwareshop.cz/tablety.html</loc>
        </url>
        <url>
                <loc>http://www.hardwareshop.cz/pc-sestavy.html</loc>
        </url>
        <url>
                <loc>http://www.hardwareshop.cz/mobilni-telefony-a-smartphony.html</loc>
        </url>
        <url>
                <loc>http://www.hardwareshop.cz/kontakty-a-oteviraci-doba.html</loc>
        </url>
</urlset>

Jednoduše do něj zapíšeme URL adresy všech podstránek na webu. Kromě lokace URL můžeme udávat i další data, jako např. datum poslední změny nebo prioritu. Pro popis dalších značek můžeme zajít např. ke Google - https://support.google.com/…nswer/183668?…. Mapu stránek často zpřístupňujeme nejen vyhledávačům, ale i uživatelům v podobě klasické HTML stránky.

Můžete také nahlédnout do souboru sitemap itnetwork.

HTML struktura

Vyhledávače parsují zdrojový kód stránek našeho webu a snaží se z něj pochopit o čem je obsah. K tomu jim samozřejmě pomáhají HTML značky. HTML je sémantický jazyk. To znamená, že jednotlivým částem webu přiděluje určitý význam. HTML není o vzhledu, stylujeme pomocí CSS. Když budete špatně používat HTML značky (např. místo tagu pro nadpis jen zvětšíte písmo), uživatel to sice nepozná, ale vyhledávač nepochopí, že je velký text nadpis a nepřisoudí mu žádnou důležitost. To se samozřejmě v konečném výsledku projeví na nízké pozici webu na SERP.

Nyní si popíšeme několik tagů, které jsou pro SEO důležité. Ačkoli to není úplně nezbytné, tak pokud nemáte silné základy HTML, doporučuji nejprve pročíst náš seriál Webové stránky krok za krokem, kde je význam jednotlivých tagů popsán.

<title>

Tag <title> by měl být vyplněný na všech podstránkách webu. Titulek je to první, s čím vyhledávač přichází do styku a jeho text se také obvykle objevuje ve výsledcích vyhledávání, které vidí uživatel. Titulek by měl být na každé podstránce unikátní. Nikdy nepoužívejte stejný titulek pro více stránek. Domovská stránka webu má obvykle titulek s jeho názvem, poté následuje pomlčka a krátký popis s co nejvíce klíčovými slovy. Např. takto:

<title>HardwareShop - Eshop s notebooky, PC komponentami, tablety a smartphony</title>

K jednotlivým podstránkám můžete připojit pro lepší optimalizaci název webu pomocí pomlčky:

<title>Notebooky a ultrabooky - HardwareShop</title>

Pamatujte na to, že tag by měl obalovat opravdu jen ta nejdůležitější klíčová slova.

Příště budeme pokračovat.


 

 

Článek pro vás napsal David Čápka
Avatar
Jak se ti líbí článek?
18 hlasů
Autor pracuje jako softwarový architekt a pedagog na projektu ITnetwork.cz (a jeho zahraničních verzích). Velmi si váží svobody podnikání v naší zemi a věří, že když se člověk neštítí práce, tak dokáže úplně cokoli.
Unicorn College Autor sítě se informační technologie naučil na Unicorn College - prestižní soukromé vysoké škole IT a ekonomie.
Předchozí článek
SEO - Další algoritmy Google a linkbuilding
Všechny články v sekci
SEO - Optimalizace webů pro vyhledávače
Miniatura
Následující článek
SEO - Optimalizace HTML struktury
Aktivity (1)

 

 

Komentáře

Avatar
Michal Žůrek - misaz:21.8.2014 20:54

Někde jsem četl že v title místo pomlčky je lepší | (Alt Gr + W), protože je to (vizuálně) kratší.

 
Odpovědět
21.8.2014 20:54
Avatar
Neaktivní uživatel:21.8.2014 21:54

O tom sitemap, jak že se to dá udělat v PHP? :D

Odpovědět
21.8.2014 21:54
Neaktivní uživatelský účet
Avatar
David Čápka
Tým ITnetwork
Avatar
Odpovídá na Neaktivní uživatel
David Čápka:21.8.2014 21:55

Když PHP slouží ke generování HTML a HTML je vlastně případ XML, je to dost jednoduché ;-) Prostě vybereš články z databáze a vypíšeš je do šablony.

Odpovědět
21.8.2014 21:55
Jsem moc rád, že jsi na síti, a přeji ti top IT kariéru, ať jako zaměstnanec nebo podnikatel. Máš na to! :)
Avatar
Odpovídá na David Čápka
Michal Žůrek - misaz:21.8.2014 22:05

hmm, tak jednoduché to není, je o tom napsaná celá kniha (docela dobrá).

http://www.grada.cz/…nam/katalog/

 
Odpovědět
21.8.2014 22:05
Avatar
Tonda Kozák
Člen
Avatar
Tonda Kozák:21.8.2014 22:13

Pěkný seriál, je tu však vždycky pár drobností, nad kterými bych (jako samouk) i polemizoval.
Třeba tady ta validita a krása adres. Nemyslím si, že by to mělo nějak velkou důležitost.

 
Odpovědět
21.8.2014 22:13
Avatar
David Čápka
Tým ITnetwork
Avatar
Odpovídá na Tonda Kozák
David Čápka:21.8.2014 22:18

SEO je hlavně o drobnostech, nic nemá velký význam, dokud to nedáš dohromady.

Odpovědět
21.8.2014 22:18
Jsem moc rád, že jsi na síti, a přeji ti top IT kariéru, ať jako zaměstnanec nebo podnikatel. Máš na to! :)
Avatar
Tonda Kozák
Člen
Avatar
Odpovídá na David Čápka
Tonda Kozák:21.8.2014 22:23

S tím souhlasím. Ale třeba validita, pokud se to i běžně v prohlížeči nerozsype, je fuk.

 
Odpovědět
21.8.2014 22:23
Avatar
Adam Ježek
Tým ITnetwork
Avatar
Adam Ježek:21.8.2014 22:37

Vždycky mě zajímala první stránka na síti. Na konci mapy jsem našel odkaz na diskuzi baf, ještě spadající pod inslandsoft, ve které nic neni :D Co to má sakra bejt ? :D Prní stránka přece musela vypadat líp! :D
http://www.itnetwork.cz/…fb8cd925dce7

Odpovědět
21.8.2014 22:37
Počkej chvíli, poradím se s křišťálovou koulí.
Avatar
David Čápka
Tým ITnetwork
Avatar
Odpovídá na Tonda Kozák
David Čápka:21.8.2014 22:42

Když tam máš nějakou vážnou chybu, tak to fuk není. Googlebot to přece taky parsuje, nezáleží na tom jak to vypadá.

Odpovědět
21.8.2014 22:42
Jsem moc rád, že jsi na síti, a přeji ti top IT kariéru, ať jako zaměstnanec nebo podnikatel. Máš na to! :)
Avatar
Tonda Kozák
Člen
Avatar
Odpovídá na David Čápka
Tonda Kozák:21.8.2014 23:31

Jaká existuje závažná chyba, která by ale nebyla ve výsledku (pro návštěvníka) viditelná?

 
Odpovědět
21.8.2014 23:31
Avatar
David Čápka
Tým ITnetwork
Avatar
Odpovídá na Tonda Kozák
David Čápka:22.8.2014 9:28

SEO není o návštěvníkovi, ale o robotovi, který parsuje HTML kód. Vidí web trochu jinak, než lidé, prohlížeč v tom vůbec nefiguruje :) Když tam budeš mít nějaký fatální nepořádek v HTML struktuře, tak ti to prohlížeč možná pobere, ale bota to zmate.

Odpovědět
22.8.2014 9:28
Jsem moc rád, že jsi na síti, a přeji ti top IT kariéru, ať jako zaměstnanec nebo podnikatel. Máš na to! :)
Avatar
Tonda Kozák
Člen
Avatar
Tonda Kozák:22.8.2014 10:54

A to si právě myslím, že není pravda. Dnešní vyhledávače jsou natolik chytré, že vědí, co návštěvníkovi vadí a co ne. Pokud to pobere prohlížeč, proč by měl být robot zmatený?

 
Odpovědět
22.8.2014 10:54
Avatar
David Čápka
Tým ITnetwork
Avatar
Odpovídá na Tonda Kozák
David Čápka:22.8.2014 11:42

Protože prohlížeč zobrazuje jak je to ostylované a robot to chápe podle sémantiky. Může nastat případ, kdy se to sice zobrazí graficky správně, ale sémanticky to nebude dávat žádný smysl. Myslím, že už jsem k tomu napsat dost, piš si to jak chceš :)

Odpovědět
22.8.2014 11:42
Jsem moc rád, že jsi na síti, a přeji ti top IT kariéru, ať jako zaměstnanec nebo podnikatel. Máš na to! :)
Avatar
Fredep
Redaktor
Avatar
Odpovídá na David Čápka
Fredep:23.8.2014 9:58

Zdravím, ten soubor sitemap se při každém přístupu generuje, nebo při založení článku/diskuze se zde jen připíše nový záznam??? Díky ;)

 
Odpovědět
23.8.2014 9:58
Tento výukový obsah pomáhají rozvíjet následující firmy, které dost možná hledají právě tebe!
Avatar
Fredep
Redaktor
Avatar
Odpovídá na David Čápka
Fredep:23.8.2014 20:33

David Čápka, promiň, zapomněl jsem tě označit. Odpovíš mi prosím na horní dotaz? :D :D

 
Odpovědět
23.8.2014 20:33
Avatar
Odpovídá na Fredep
Michal Žůrek - misaz:23.8.2014 20:41

to je jedno, když si ho robot stáhne musí být aktuální.

 
Odpovědět
23.8.2014 20:41
Avatar
Fredep
Redaktor
Avatar
Odpovídá na Michal Žůrek - misaz
Fredep:24.8.2014 10:51

To chápu, spíš by mě zajímalo, co je vhodnější použít pro tak velký web...

 
Odpovědět
24.8.2014 10:51
Avatar
Odpovídá na Fredep
Michal Žůrek - misaz:24.8.2014 10:57

pro velké weby se to generuje automaticky. Většinou tyto weby mají všechno v databázích, tak to není žádný problém.

 
Odpovědět
24.8.2014 10:57
Avatar
Jan Poláček
Redaktor
Avatar
Jan Poláček:25.8.2014 22:29

Ahoj, jak to funguje s těmi hezkými adresami? .htaccess předá GET proměnnou skriptu url název stránky, např. seo-optimalizace-webu-pro-vyhledavace-struktura-webu a skript vyhledá tuto stránku v DB a zobrazí? Pokud ano, jakým způsobem zajistit jedinečnost url, přece jen url dvou stránek nemůže být poté stejné, protože by skript nevěděl, jakou stránku zobrazit. Nebo se to dělá jinak?

Odpovědět
25.8.2014 22:29
Instrukce na adrese 0x77104f29 odkazovala na adresu paměti 0x00000014. S pamětí nelze provést operaci: written.
Avatar
Odpovídá na Jan Poláček
Michal Žůrek - misaz:25.8.2014 22:33

URL musí být vždy jedinečná, to platí jak pro hezké URL, tak pro "škaredé". V htaccess pomocí mode_rewrite vesměs přepíšeš hezkou URL na škaredou. Další možnost (kterou popisují třeba zdejší tutoriály) je, že v htaccess všechno pošleš na index a ten to zpracuje.

 
Odpovědět
25.8.2014 22:33
Avatar
Odpovídá na David Čápka
Neaktivní uživatel:26.8.2014 8:13

Validita html nemá vůbec žádný dopad na SEO. Roboti to mají na háku :)

Odpovědět
26.8.2014 8:13
Neaktivní uživatelský účet
Avatar
Odpovídá na Jan Poláček
Neaktivní uživatel:26.8.2014 8:15

To se můžeš podívat v seriálu Objektový redakční systém v PHP, tam se to hezky řeší. Základem většinou bývá tu url rozsekat na části a podle ní si volat kompomenty, které jí pracují nebo rozhodnou, kterou další komponentu volat. Je vhodné na to použít nějakou architekturu, například zde velmi oblímené MVC.

Odpovědět
26.8.2014 8:15
Neaktivní uživatelský účet
Avatar
Marcel Smolik:13.6.2015 18:09

Otázka nemůže nějaký Hacker hacknout google a přepsat roboty aby napadaly servry

 
Odpovědět
13.6.2015 18:09
Avatar
Adam Ježek
Tým ITnetwork
Avatar
Odpovídá na Marcel Smolik
Adam Ježek:13.6.2015 21:13

Asi to sem nepatri, ale muze. Maj to zabezpeceby, ale muze se objevit nekdo kdo najde zpusob jak to obejit a necha je indexovat jen jednu stranku furt dokola -> DDoS

Odpovědět
13.6.2015 21:13
Počkej chvíli, poradím se s křišťálovou koulí.
Avatar
tomasmanhal
Člen
Avatar
Odpovídá na Marcel Smolik
tomasmanhal:13.6.2015 21:40

Velmi nepravděpodobné. Na 100% mají v Google na serverech několika stupňové zabezpečení a hlavně jsou roboti vypouštěni z náhodného serveru (moje domněnka) aby se právě zamezilo nějakému napadení nebo pokusu o manipulaci s nimi. Nemluvě o tom, že neustále někdo monitoruje pohyb a jakoukoliv abnormalitu ihned řeší.

Proč by někdo složitě lámal bezpečnostní politiku Google, když může DDoS způsobit mnohem snáze a levněji i jinak? :-)

Odpovědět
13.6.2015 21:40
Kdyby nám dodali k životu zdrojový kód, vše by bylo jednodušší...
Avatar
Adam Ježek
Tým ITnetwork
Avatar
Odpovídá na tomasmanhal
Adam Ježek:13.6.2015 21:57

Treba aby poskodil povest Googlu? Je spousta lidi, kterejm by prospela tahle afera s googlem

Odpovědět
13.6.2015 21:57
Počkej chvíli, poradím se s křišťálovou koulí.
Avatar
mkub
Redaktor
Avatar
Odpovídá na Marcel Smolik
mkub:13.6.2015 23:09

trosku odveci otazka... je upne off-topic...
poloz ju do fora venovaneho bezpecnosti...

 
Odpovědět
13.6.2015 23:09
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 27 zpráv z 27.