2. díl - SEO - Princip internetových vyhledávačů a Google PageRank

HTML a CSS SEO SEO - Princip internetových vyhledávačů a Google PageRank

V minulém dílu našeho seriálu o SEO jsme si udělali úvod do problematiky optimalizace webových stránek pro vyhledávače. V dnešním dílu pochopíme jakým způsobem vyhledávače weby hodnotí.

Se vznikem internetu začal být okamžitě problém s vyhledáváním, jelikož nikde neexistuje mapa všech webových stránek, které jsou na něm uložené. Když uživatel potřebuje nějakou informaci, musí nejprve nějakým způsobem zjistit adresu webu, který tuto informaci obsahuje.

Katalogy

Nejjednodušší řešení je mapu stránek ručně sestavit, říkáme ji poté katalog. Autoři webů přidají své stránky do katalogu, ve kterém následně uživatelé vyhledávají. Tímto způsobem dříve fungoval seznam.cz, než se přeorientoval na fulltextový vyhledávač. Největším katalogem je http://www.dmoz.org/, ve kterém je vloženo přes 4.000.000 stránek.

Katalogy se v dnešní době již téměř nepoužívají a registrace do nich může vašemu webu i vážně ublížit. Získáte totiž zpětné odkazy (viz. dále) ze stránek, na kterých není žádný obsah a jen spousta odkazů. Pokud se zaregistrujete do velkého počtu katalogů, může si váš web dokonce vysloužit i nehezkou penalizaci, protože Google pochopí odkazy jako nepřirozené a podezřelé (a to také jsou, když jste si je vytvořili sami :) ). Hodilo by se zmínit, že existují placené služby, které slibují zvýšení vašeho SEO pomocí registrace do takovýchto katalogů. Myslím, že se to v dnešní době již nevyplatí riskovat.

Katalogy dříve mívaly opravdu vysoké ranky, nyní je jejich význam zanedbatelný.

Vyhledávače

Internetové vyhledávače používají tzv. crawlery (často se jim říká také pavouci, roboti nebo jen boti). Crawler je software, který běží někde v serverovnách vyhledávače. Jeho úkolem je prohledávat webové stránky, které si přidává do databáze. Pokud je na prohledávaném webu nějaký odkaz, crawler si ho uloží a následně se na něj také přesune. Jelikož na sebe stránky na internetu vzájemně odkazují, podaří se robotům tímto způsobem prolézt celý internet a získají přehled o tom, co je kde uloženo. Díky databázi těchto informací můžeme na internetu vyhledávat a to aniž by lidé museli ručně vkládat nebo aktualizovat nějaké katalogy.

Možná vás napadá, jak Google přijde na stránku, která je na internetu nová a nikdo na ni ještě neodkazuje. O takové stránce můžete Googlu říci pomocí formuláře na http://www.google.com/…s/submit-url. Jakmile ji robot jednou nalezne, bude se na ni pravidelně vracet, aby zaindexoval změny a nově přidané stránky. Čím je web větší a aktuálnější, tím častěji se na něj roboti vrací.

Robotu Googlu se říká Googlebot, robotu Seznamu SeznamBot. Ve výchozím nastavení se roboti snaží indexovat vše co jen jde. Nemusíme se o ně vůbec starat ani na web vkládat nějaké speciální značky. Někdy je žádoucí, aby roboti nějakou URL adresu neindexovali. K tomu se používají buď metaznačky v HTML kódu nebo soubor robots.txt. Robotům můžeme pomoci při indexování ještě poskytnutím mapy webu (tzv. sitemap). V seriálu se k tomuto tématu ještě vrátíme.

PageRank

Kdyby vyhledávač jen naindexoval celý internet, nebylo by to příliš přínosné. Je na něm totiž obrovské množství webů (a jejich podstránek), mezi kterými se musí sofistikovanými algoritmy filtrovat, aby na konci zůstalo jen to, co uživatel opravdu hledá. Vyhledávač musí ve webovém indexu:

  1. Pochopit, o čem web je, aby ho mohl správně zařadit a nabízet ve výsledcích vyhledávání
  2. Přiřadit webu hodnocení vzhledem k jeho velikosti a kvalitě jeho obsahu

Google používá k hodnocení webů více než 200 různých algoritmů. Tím prvním a nejvýznamnějším algoritmem je Google PageRank (zkráceně GPR). Ačkoli PageRank není jediný algoritmus, který o pozici ve výsledcích rozhoduje, je jeho princip velmi důležitý.

Princip

Základním předpokladem je, že na kvalitní web odkazují ostatní weby. Čím je web zajímavější, tím více lidí si o něm povídá a zmiňují ho na svých stránkách v podobě odkazů. O těchto odkazech hovoříme jako o zpětných, jsou to odkazy z cizích webů na náš web. Zjednodušeně můžeme říci, že čím více webů na náš web odkazuje, tím jako zajímavější ho Google (nebo ostatní vyhledávače) vnímá.

Google poskytuje ukazatel PageRanku jako tzv. Toolbar PageRank a to jako číslo od 0 do 10. Tento údaj se obnovuje jen jednou za čas (asi 2x za rok) a je pouze orientační. Interně má Google svůj vnitřní rank, který se často přepočítává a který není vidět.

Hodnotu Toolbar PageRanku svého webu si můžete zjistit např. na http://ranky.cz/. Naleznete zde i hodnotu Sranku (obdoba GPR od Seznam.cz). Zrovna pro itnetwork není Toolbar hodnota ještě aktualizovaná kvůli nové doméně. Pagerank má jak celá doména, tak jednotlivé podstránky.

Přelévání ranků

Výsledná hodnota GPR našeho webu vychází ze součtu GPR všech webů, které na nás odkazují.

Google PageRank

Čím větší GPR mají zpětné odkazy na náš web, tím pozitivnější vliv mají na celkové GPR našeho webu. Možná vás napadlo, co se stane, když na sebe 2 weby navzájem odkazují. Takový výsledný efekt je bohužel minimální. V rámci SEO je tedy v našem zájmu získat co nejvíce zpětných odkazů z co nejkvalitnějších webů a to ideálně tak, abychom my na tyto weby neodkazovali. Když náš web odkazuje na příliš mnoho ostatních webů, jeho GPR se snižuje.

Hodnoty

Pokud Google nějakou stránku vůbec nezná, rovná se její rank 0. Mezi vyššími hodnotami jsou stále vyšší propasti. Zatímco hodnot 1-3 je poměrně jednoduché dosáhnout, hodnoty 4 a výše získáte většinou jen když se webu opravdu intenzivně věnujete. Vysokých hodnot nelze v českých podmínkách rozumně dosáhnout. Pro lepší příklad si uveďme několik webů a jejich GPR (GPR se v čase mění, takže hodnoty jsou ilustrativní):

  • PageRank 10: twitter.com, usa.gov (americká vláda)
  • PageRank 9: google.com -(opravdu, ani Google nemá hodnotu 10, takže my na ni můžeme zcela jistě zapomenout :) ), facebook.com, apple.com
  • PageRank 8: microsoft.com
  • PageRank 7: seznam.cz, idnes.cz
  • PageRank 6: Google.cz, lupa.cz
  • PageRank 5: lide.cz

Itnetwork míval na předchozí doméně GPR 4.

Níže přikládám sice starší, ale stále výstižný obrázek, díky kterému získáme představu o rozpětí hodnot GPR.

Google PageRank
Vývoj internetu

Možná vás napadlo, že internet se přeci stále rozšiřuje. Stránky mají časem více a více článků a algoritmus ranku by se tomu měl nějak přizpůsobit. Je tomu tak, hodnocení Googlu je stále přísnější a přísnější. Aktualizace algoritmu přicházejí asi 2x za rok a musíme se často smířit s tím, že když se náš rank po updatu nezmění, je to ta nejlepší možná varianta :) Že Google sám sobě vypočítá 9 a ne 10 je toho důkazem.

Nejhorší update Google PageRanku
Význam

Google PageRank bychom měli brát jako jeden ze SEO ukazatelů. Ačkoli je velmi důležitý, nemá smysl se bezhlavě zaměřovat pouze na zvýšení tohoto čísla. Weby děláte pro lidi a existuje spousta stránek, které nemají vysoké GPR a přesto jsou velmi populární. Google používá kromě GPR spoustu dalších algoritmů, o nejdůležitějších 3 si řekneme příště. Řeč bude i o penalizacích a jak jim předejít.


 

  Aktivity (1)

Článek pro vás napsal David Čápka
Avatar
Autor pracuje jako softwarový architekt a pedagog na projektu ITnetwork.cz (a jeho zahraničních verzích). Velmi si váží svobody podnikání v naší zemi a věří, že když se člověk neštítí práce, tak dokáže úplně cokoli.
Unicorn College Autor se informační technologie naučil na Unicorn College - prestižní soukromé vysoké škole IT a ekonomie.

Jak se ti líbí článek?
Celkem (12 hlasů) :
4.833334.833334.833334.833334.83333


 



 

 

Komentáře

Avatar
Old Account
Člen
Avatar
Old Account:

Algoritmy ktore sa staraju o vyhodnocovanie stranok nie su az tak dolezite, dolezite je nastavenia radiacich filtrov. Vdaka spravnemu nastaveniu (ktore si vyzaduje mesiace, ba i roky testovania) dokaze aj Vas vyhladavac ponukat relevantne vysledky ako Google.

Odpovědět 18.8.2014 13:34
"If you keep your eye on the profit, you’re going to skimp on the product. But if you focus on making really gre...
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 1 zpráv z 1.