4. díl - SEO - Optimalizace struktury webu

HTML a CSS SEO SEO - Optimalizace struktury webu

V minulém dílu našeho seriálu o SEO jsme probrali další algoritmy Google, téma penalizace a také jak správně vytvářet zpětné odkazy. Následující část seriálu je věnována tomu, jak navrhnout web, aby byl pro vyhledávače co nejoptimálnější.

Hezké URL adresy

Než se vyhledávač vůbec dostane na naši webovou stránku, projde přes URL adresu. Představte si, že vypadá nějak takto:

http://www.totojemujweb.cz/clanek.php?id=1234b=11

Vyhledávač z toho nebude příliš moudrý a navíc ho zmate větší množství parametrů. Přicházíme také o skvělou příležitost podstrčit mu klíčová slova. Vyhledávače totiž přisuzují relevanci mimo jiné i podle nejlepší shody klíčových slov a ta čerpají i z URL adresy. Hezké URL adresy (Pretty URL) se skládají jen ze slov a jsou důležitou součástí SEO. Slova jsou oddělena pomlčkami. V adresách se vyhněte používání velkých písmen, mezer, diakritice a zkrátka všemu, co by mohlo znepříjemnit jejich opisování nebo zpracování. Již příliš nezáleží na tom, zda adresa odpovídá skutečnému umístění dokumentu:

http://www.hardwareshop.cz/notebooky/notebook-lenovo-abc-123.html

Nebo slouží jen jako text, podle kterého se vybírá dokument z databáze:

http://www.hardwareshop.cz/notebooky/detail/notebook-lenovo-abc-123

Pozn.: Doména hardwareshop.cz je zvolena čistě náhodně.

Můžete se pro ilustraci také podívat na URL tohoto článku :) Hezké URL adresy jsou přínosné i pro lidi. Ono vůbec většinou platí, že když uděláme něco pro lidi, bude se to líbit i vyhledávačům. URL adresa je mimo jiné vidět i na SERP (stránce s výsledky vyhledávání).

Každý dokument by měl být na webu přístupný jen pod jednou URL adresou. Měla by fungovat jak verze adresy s www., tak i bez www. Verze bez www. by měla odkazovat na verzi s www. a to pomocí přesměrování 301, aby to vyhledávače nechápali jako novou URL adresu. Stejně tak by na stejný článek neměly odkazovat různé subdomény. Pokud chcete z nějakého důvodu odkazovat na jeden článek pomocí více URL adres, uveďte u odkazu atribut rel="canonical".

Dostupnost

Web by se měl rychle načítat a být tedy dostupný. Doba generování stránky na straně serveru se obvykle pohybuje kolem 100ms, říká se, že do 500ms je to ještě snesitelné, i když už nepohodlné. Kromě doby generování je důležitá i celková doba načítání stránky (měla by být asi do 3 vteřin). Tu vám změří např. Chrome ve vývojářské konzoli (F12) nebo nástroj Google Analytics, o kterém si řekneme příště. Obecně platí, že čím je web rychlejší, tím více má přístupů. Pokud budete šetřit za webhosting, přijdete o řádově vyšší částky na ztrátách kvůli výpadkům nebo nižší aktivitě uživatelů. Je dokázáno, že na pomalých webech uživatelé zobrazí menší množství stránek a to i když se doba načítání zvýší např. jen o několik set ms. Výpadky nebo pomalé načítání stránek samozřejmě znemožňuje naše stránky používat jak lidem, tak i robotům. Mohou nastat i problémy s indexováním.

Validita

Náš web by měl být ideálně validní podle W3C specifikace. Prakticky je pro to nutné vynaložit poměrně velké úsilí a to hlavně kvůli různým editorům článků a podobně. Validátor nemusí váš web označit jako 100% validní, přiznejme si, že tyto weby jsou většinou umělé a ne příliš přínosné. Na živém webu nám vždy něco ujede a v dnešní době je zbytečné řešit každou podstránku. Základní kostra stránky by však měla být stoprocentní, neměli byste zapomínat na doctype, znakovou sadu, správnou definici hlavičky, oddělování JavaScriptu a CSS kódu do samostatných souborů a podobně.

Mapa stránek

Každý web by měl poskytovat mapu všech svých podstránek. Jedná se o XML dokument, který můžeme v případě malého počtu stránek napsat sami. Můžeme si ho nechat vygenerovat pomocí generátoru sitemap. Nebo si ho můžeme vytvořit velmi jednoduše pomocí PHP. Na názvu ani umístění souboru nezáleží, robotům o něm řekneme pomocí souboru robots.txt, o kterém si však povíme až v dalších dílech, nebo pomocí nástroje Google Analytics, jehož představení nás rovněž teprve čeká. Soubor sitemap.xml může v úplně nejjednodušší podobě vypadat např. takto:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
        <url>
                <loc>http://www.hardwareshop.cz/notebooky-a-ultrabooky.html</loc>
        </url>
        <url>
                <loc>http://www.hardwareshop.cz/tablety.html</loc>
        </url>
        <url>
                <loc>http://www.hardwareshop.cz/pc-sestavy.html</loc>
        </url>
        <url>
                <loc>http://www.hardwareshop.cz/mobilni-telefony-a-smartphony.html</loc>
        </url>
        <url>
                <loc>http://www.hardwareshop.cz/kontakty-a-oteviraci-doba.html</loc>
        </url>
</urlset>

Jednoduše do něj zapíšeme URL adresy všech podstránek na webu. Kromě lokace URL můžeme udávat i další data, jako např. datum poslední změny nebo prioritu. Pro popis dalších značek můžeme zajít např. ke Google - https://support.google.com/…nswer/183668?…. Mapu stránek často zpřístupňujeme nejen vyhledávačům, ale i uživatelům v podobě klasické HTML stránky.

Můžete také nahlédnout do souboru sitemap itnetwork.

HTML struktura

Vyhledávače parsují zdrojový kód stránek našeho webu a snaží se z něj pochopit o čem je obsah. K tomu jim samozřejmě pomáhají HTML značky. HTML je sémantický jazyk. To znamená, že jednotlivým částem webu přiděluje určitý význam. HTML není o vzhledu, stylujeme pomocí CSS. Když budete špatně používat HTML značky (např. místo tagu pro nadpis jen zvětšíte písmo), uživatel to sice nepozná, ale vyhledávač nepochopí, že je velký text nadpis a nepřisoudí mu žádnou důležitost. To se samozřejmě v konečném výsledku projeví na nízké pozici webu na SERP.

Nyní si popíšeme několik tagů, které jsou pro SEO důležité. Ačkoli to není úplně nezbytné, tak pokud nemáte silné základy HTML, doporučuji nejprve pročíst náš seriál Webové stránky krok za krokem, kde je význam jednotlivých tagů popsán.

<title>

Tag <title> by měl být vyplněný na všech podstránkách webu. Titulek je to první, s čím vyhledávač přichází do styku a jeho text se také obvykle objevuje ve výsledcích vyhledávání, které vidí uživatel. Titulek by měl být na každé podstránce unikátní. Nikdy nepoužívejte stejný titulek pro více stránek. Domovská stránka webu má obvykle titulek s jeho názvem, poté následuje pomlčka a krátký popis s co nejvíce klíčovými slovy. Např. takto:

<title>HardwareShop - Eshop s notebooky, PC komponentami, tablety a smartphony</title>

K jednotlivým podstránkám můžete připojit pro lepší optimalizaci název webu pomocí pomlčky:

<title>Notebooky a ultrabooky - HardwareShop</title>

Pamatujte na to, že tag by měl obalovat opravdu jen ta nejdůležitější klíčová slova.

Příště budeme pokračovat.


 

  Aktivity (1)

Článek pro vás napsal David Čápka
Avatar
Autor pracuje jako softwarový architekt a pedagog na projektu ITnetwork.cz (a jeho zahraničních verzích). Velmi si váží svobody podnikání v naší zemi a věří, že když se člověk neštítí práce, tak dokáže úplně cokoli.
Unicorn College Autor se informační technologie naučil na Unicorn College - prestižní soukromé vysoké škole IT a ekonomie.

Jak se ti líbí článek?
Celkem (14 hlasů) :
4.928574.928574.928574.928574.92857


 



 

 

Komentáře
Zobrazit starší komentáře (17)

Avatar
Michal Žůrek (misaz):

pro velké weby se to generuje automaticky. Většinou tyto weby mají všechno v databázích, tak to není žádný problém.

Odpovědět  +2 24.8.2014 10:57
Nesnáším {}, proto se jim vyhýbám.
Avatar
Jan Poláček (johny881):

Ahoj, jak to funguje s těmi hezkými adresami? .htaccess předá GET proměnnou skriptu url název stránky, např. seo-optimalizace-webu-pro-vyhledavace-struktura-webu a skript vyhledá tuto stránku v DB a zobrazí? Pokud ano, jakým způsobem zajistit jedinečnost url, přece jen url dvou stránek nemůže být poté stejné, protože by skript nevěděl, jakou stránku zobrazit. Nebo se to dělá jinak?

Odpovědět 25.8.2014 22:29
Instrukce na adrese 0x77104f29 odkazovala na adresu paměti 0x00000014. S pamětí nelze provést operaci: written.
Avatar
Odpovídá na Jan Poláček (johny881)
Michal Žůrek (misaz):

URL musí být vždy jedinečná, to platí jak pro hezké URL, tak pro "škaredé". V htaccess pomocí mode_rewrite vesměs přepíšeš hezkou URL na škaredou. Další možnost (kterou popisují třeba zdejší tutoriály) je, že v htaccess všechno pošleš na index a ten to zpracuje.

Odpovědět 25.8.2014 22:33
Nesnáším {}, proto se jim vyhýbám.
Avatar
Jiří Gracík
Redaktor
Avatar
Jiří Gracík:

Validita html nemá vůbec žádný dopad na SEO. Roboti to mají na háku :)

Odpovědět 26.8.2014 8:13
Creating websites is awesome till you see the result in another browser ...
Avatar
Jiří Gracík
Redaktor
Avatar
Odpovídá na Jan Poláček (johny881)
Jiří Gracík:

To se můžeš podívat v seriálu Objektový redakční systém v PHP, tam se to hezky řeší. Základem většinou bývá tu url rozsekat na části a podle ní si volat kompomenty, které jí pracují nebo rozhodnou, kterou další komponentu volat. Je vhodné na to použít nějakou architekturu, například zde velmi oblímené MVC.

Odpovědět 26.8.2014 8:15
Creating websites is awesome till you see the result in another browser ...
Avatar
Marcel Smolik:

Otázka nemůže nějaký Hacker hacknout google a přepsat roboty aby napadaly servry

 
Odpovědět  -2 13.6.2015 18:09
Avatar
Adam Ježek
Tým ITnetwork
Avatar
Odpovídá na Marcel Smolik
Adam Ježek:

Asi to sem nepatri, ale muze. Maj to zabezpeceby, ale muze se objevit nekdo kdo najde zpusob jak to obejit a necha je indexovat jen jednu stranku furt dokola -> DDoS

Odpovědět 13.6.2015 21:13
Programátor dělá co může. Počítač co chce. | Pokud mi dáš mínus, tak prosim, napiš proč!
Avatar
tomasmanhal
Člen
Avatar
Odpovídá na Marcel Smolik
tomasmanhal:

Velmi nepravděpodobné. Na 100% mají v Google na serverech několika stupňové zabezpečení a hlavně jsou roboti vypouštěni z náhodného serveru (moje domněnka) aby se právě zamezilo nějakému napadení nebo pokusu o manipulaci s nimi. Nemluvě o tom, že neustále někdo monitoruje pohyb a jakoukoliv abnormalitu ihned řeší.

Proč by někdo složitě lámal bezpečnostní politiku Google, když může DDoS způsobit mnohem snáze a levněji i jinak? :-)

Odpovědět 13.6.2015 21:40
Kdyby nám dodali k životu zdrojový kód, vše by bylo jednodušší...
Avatar
Adam Ježek
Tým ITnetwork
Avatar
Odpovídá na tomasmanhal
Adam Ježek:

Treba aby poskodil povest Googlu? Je spousta lidi, kterejm by prospela tahle afera s googlem

Odpovědět 13.6.2015 21:57
Programátor dělá co může. Počítač co chce. | Pokud mi dáš mínus, tak prosim, napiš proč!
Avatar
mkub
Redaktor
Avatar
Odpovídá na Marcel Smolik
mkub:

trosku odveci otazka... je upne off-topic...
poloz ju do fora venovaneho bezpecnosti...

 
Odpovědět 13.6.2015 23:09
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 10 zpráv z 27. Zobrazit vše