Lekce 2 - SEO - Internetové vyhledávače a PageRank

V minulé lekci, SEO - Úvod do optimalizace webů pro vyhledávače, jsme si uvedli základy optimalizace pro vyhledávače, organickou návštěvnost, klíčová slova a cíle SEO.

V tomto SEO tutoriálu si vysvětlíme, jak fungují internetové vyhledávače a proč nestačí, aby webová stránka pouze existovala. Ukážeme si rozdíl mezi katalogem a fulltextovým vyhledávačem, projdeme si pojmy procházení, indexace a řazení výsledků a představíme si algoritmus PageRank.

Ilustrační foto k SEO a vyhledávání na webu - SEO - Optimalizace webů pro vyhledávače

Katalogy

Na začátku internetu bylo webových stránek málo. Nejjednodušším řešením bylo ručně sestavit jejich seznam. Takovému seznamu říkáme katalog.

Katalog fungoval podobně jako telefonní seznam firem. Autor webu svou stránku přidal do příslušné kategorie a uživatelé potom procházeli témata ručně. Tímto způsobem dříve fungovaly i některé velké webové služby. Známým světovým katalogem byl DMOZ, jehož provoz skončil v roce 2017.

Katalogy měly jednu velkou nevýhodu. Musel je spravovat člověk nebo komunita lidí. Jakmile začal web rychle růst, ruční zařazování přestalo stačit. Každý den vznikaly nové stránky, staré se měnily a některé zanikaly. Internet proto potřeboval systém, který dokáže web objevovat automaticky.

Historicky mohly katalogy pomoci novému webu získat první odkazy. Dnes má smysl hlavně kvalitní oborový katalog nebo ověřená databáze firem. Hromadná registrace do nekvalitních katalogů naopak může působit nepřirozeně a webu spíše uškodit.

Fulltextové vyhledávače

Moderní vyhledávače nečekají, až jim autor webu stránku ručně přidá do seznamu. Samy procházejí web, sledují odkazy a ukládají informace o nalezených stránkách. Tomuto typu vyhledávání říkáme fulltextové vyhledávání.

Fulltextový vyhledávač nepracuje jen s názvem webu nebo kategorií. Analyzuje samotný obsah stránky. Zjišťuje, jaké texty stránka obsahuje, jaké má nadpisy, kam odkazuje a jak souvisí s ostatními stránkami.

Z pohledu SEO je důležité, že vyhledávač stránku nejdříve musí objevit, přečíst a pochopit. Pokud stránka není technicky dostupná nebo nemá srozumitelný obsah, vyhledávač s ní bude pracovat hůře.

Práce vyhledávače se stránkou

Vyhledávač funguje trochu jako obrovská knihovna. Knihu nestačí jen mít někde v regálu. Knihovník ji musí najít, zařadit a při dotazu čtenáře vybrat právě ty knihy, které mu nejlépe pomohou. Vyhledávač pracuje obdobně. Nejprve stránky objevuje, potom si ukládá informace o jejich obsahu a nakonec vybírá výsledky, které nejlépe odpovídají dotazu.

Vyhledávač musí stránku nejdříve najít, potom si o ní uložit informace a nakonec rozhodnout, kdy ji nabídne uživateli. Se stránkou proto pracuje ve třech hlavních krocích: procházení (crawling), indexace (indexing) a řazení výsledků (ranking).

Schéma práce vyhledávače se stránkou - SEO - Optimalizace webů pro vyhledávače

Procházení

První fází je procházení. Tuto práci vykonává robot, kterému se říká také crawler, bot nebo spider. Robot prochází internet, otevírá stránky a sleduje odkazy. U Googlu se tento robot jmenuje Googlebot, u Seznamu SeznamBot.

Představme si robota jako návštěvníka, který prochází město podle cedulí. Když na jedné budově najde ukazatel k další ulici, vydá se tím směrem. Odkazy na webu fungují podobně. Pomáhají robotovi objevovat nové stránky a chápat vztahy mezi nimi.

Vyhledávač může nové URL adresy objevit přes odkazy, pomocí souboru sitemap.xml nebo přes nástroj pro webmastery, například Google Search Console. Odeslání stránky ale neznamená, že ji vyhledávač automaticky zařadí do výsledků. Vždy záleží také na kvalitě obsahu, technickém stavu webu a rozhodnutí samotného vyhledávače.

Indexace

Druhou fází je indexace. Vyhledávač analyzuje obsah stránky a rozhoduje, zda ji uloží do indexu. Index je rozsáhlá databáze informací o stránkách, které robot objevil a vyhledávač je zpracoval.

Index v knihovním přirovnání odpovídá kartotéce. Neobsahuje jen název knihy, ale také informace o tématu, obsahu a souvislostech. Nestačí tedy, že robot stránku navštívil. Stránka se do výsledků dostane až tehdy, když ji vyhledávač zaindexuje.

Indexaci může bránit i naše vlastní nastavení. Když například do HTML stránky vložíme tag <meta name="robots" content="noindex">, říkáme vyhledávači, aby stránku do indexu nezařazoval. Procházení některých částí webu může omezovat také soubor robots.txt.

Soubor robots.txt řeší hlavně procházení stránky robotem. Oproti tomu hodnota noindex v HTML tagu <meta> řeší zařazení stránky do indexu. Tyto nástroje používáme opatrně, abychom omylem nezablokovali důležité stránky.

Řazení výsledků

Třetí fází je řazení výsledků, anglicky ranking. Když uživatel zadá dotaz, vyhledávač v indexu najde stránky, které s dotazem souvisejí. Potom je seřadí tak, aby nahoře zobrazil nejrelevantnější výsledky.

Stránce s výsledky vyhledávání se někdy říká SERP, z anglického Search Engine Results Page. V praxi jde o stránku, kterou uživatel vidí po zadání dotazu do vyhledávače.

Vyhledávač při řazení nepracuje s jediným faktorem. Hodnotí například shodu obsahu s dotazem, kvalitu stránky, použitelnost, jazyk, lokalitu uživatele, důvěryhodnost zdroje a odkazy z jiných webů. Z pohledu SEO proto nestačí být v indexu. Stránka musí být pro konkrétní dotaz také dostatečně relevantní.

PageRank

Jedním z nejznámějších algoritmů Googlu je PageRank. Název souvisí se spoluzakladatelem Googlu Larrym Pagem. PageRank byl historicky zásadní, protože přinesl jednoduchou myšlenku: odkaz z jedné stránky na druhou můžeme chápat jako doporučení.

Kdyby vyhledávač hodnotil pouze výskyt slov na stránce, bylo by snadné výsledky zmanipulovat. Stačilo by opakovat vyhledávaný výraz mnohokrát. PageRank přidal další pohled. Začal sledovat, které stránky doporučují jiné stránky pomocí odkazů.

Představme si odbornou konferenci. Když řečníka doporučí několik uznávaných odborníků, budeme mu pravděpodobně věřit více než člověku, o kterém nikdo v oboru neslyšel. PageRank pracuje s podobnou myšlenkou. Odkaz z důvěryhodné stránky má větší váhu než odkaz z náhodného a nekvalitního webu.

Princip PageRanku

Základní princip PageRanku říká, že stránka získává hodnotu z odkazů, které na ni vedou. Nezáleží ale jen na počtu odkazů. Důležitá je také kvalita a autorita stránek, ze kterých odkazy přicházejí.

Zkratka GPR na obrázku znamená Google PageRank. Čísla u jednotlivých stránek nám pomáhají představit si, že některé stránky mají větší váhu než jiné:

Zjednodušené schéma Google PageRanku - SEO - Optimalizace webů pro vyhledávače

Hodnota PageRanku se často vysvětluje jako přelévání hodnoty přes odkazy. Stránka, která odkazuje na další stránky, část své hodnoty předává dál. Pokud odkazuje na mnoho různých míst, hodnota se mezi odkazy rozděluje.

Tento princip pomáhá pochopit také význam interních odkazů. Interní odkazy pomáhají vyhledávači objevovat důležité stránky a chápat jejich vztahy. Pokud na důležitou stránku nevede žádný vnitřní odkaz, vyhledávač ji může považovat za méně významnou.

Veřejné hodnoty PageRanku

Dříve bylo možné sledovat veřejnou hodnotu PageRanku na stupnici od 0 do 10. Tato metrika se zobrazovala například pomocí nástrojových lišt v prohlížeči. Mnoho lidí ji tehdy bralo jako jednoduché číslo, které mělo vyjadřovat sílu webu.

Google ale veřejné zobrazování PageRanku zrušil. Dnes už přesnou hodnotu PageRanku nezjistíme a staré hodnoty mají pouze historický význam.

Smysl má tedy chápat princip PageRanku, ne hledat konkrétní číslo. Odkazy stále pomáhají vyhledávačům rozpoznávat vztahy mezi stránkami a důvěryhodnost zdrojů.

PageRank v současném SEO

PageRank dnes nebereme jako jediný ukazatel úspěchu. Moderní vyhledávače hodnotí mnoho signálů najednou. Přesto je princip odkazů jako doporučení stále důležitý.

Google PageRank v průběhu let výrazně upravil. Princip práce s odkazy ale zůstává součástí hodnocení výsledků. Neznamená to, že bychom měli SEO stavět jen na získávání odkazů. Kvalitní obsah, technický stav webu, užitečnost stránky a důvěryhodnost zdroje jsou stejně důležité součásti celého obrazu.

V praxi se někdy používají metriky nástrojů třetích stran, například Domain Rating od Ahrefs nebo Domain Authority od Mozu. Tyto hodnoty mohou pomoci s orientačním srovnáním webů, ale nejsou součástí algoritmu Googlu. Nelze je tedy zaměňovat za skutečné hodnocení webu ve vyhledávání.

Z hlediska SEO je důležitější přemýšlet o tom, zda web získává odkazy přirozeně, zda má užitečný obsah a zda na něj odkazují relevantní zdroje. PageRank nám pomáhá pochopit, proč odkazy historicky hrály tak velkou roli.

Závěr

Vyhledávače fungují ve třech základních fázích: procházejí web, ukládají informace do indexu a řadí výsledky podle relevance. Katalogy byly důležité historicky, ale moderní vyhledávání stojí hlavně na automatickém procházení a hodnocení obsahu. PageRank ukázal, že odkazy mohou fungovat jako doporučení mezi stránkami. Dnes už jeho veřejnou hodnotu neměříme, ale princip odkazové autority zůstává pro SEO důležitý.

V příští lekci, SEO - Algoritmy Google a kvalita výsledků, si vysvětlíme, jak algoritmy vyhledávačů ovlivňují řazení výsledků. Ukážeme si, jak souvisí relevance, užitečný obsah, důvěryhodnost zdroje a hlavní aktualizace Googlu s tím, které stránky se zobrazí ve výsledcích vyhledávání.

Článek pro vás napsal David Hartinger

Uživatelské hodnocení:

235 hlasů

David je zakladatelem ITnetwork a programování se profesionálně věnuje 15 let. Má rád Nirvanu, nemovitosti a svobodu podnikání.

David se informační technologie naučil na Unicorn University - prestižní soukromé vysoké škole IT a ekonomie.

Aktivity

Nejčastěji vyhledáváné