IT rekvalifikace s garancí práce. Seniorní programátoři vydělávají až 160 000 Kč/měsíc a rekvalifikace je prvním krokem. Zjisti, jak na to!
Hledáme nové posily do ITnetwork týmu. Podívej se na volné pozice a přidej se do nejagilnější firmy na trhu - Více informací.

Diskuze: Co se stane když můj robot stáhne web zakázaný souborem robots.txt

Aktivity
Avatar
Neaktivní uživatel:9.6.2018 21:52

Mám robota na stahování webů ale neumí pracovat s robots.txt. Může se mně stát něco vážného když robot stáhne web zakázaný souborem robots.txt? Není to nelegální?

Odpovědět
9.6.2018 21:52
Neaktivní uživatelský účet
Avatar
Jindřich Máca
Tvůrce
Avatar
Odpovídá na Neaktivní uživatel
Jindřich Máca:9.6.2018 22:01

Vyloženě nelegální to není, spíše je to otázka etiky. Když si nějaká stránka prostě nepřeje být procházená a indexovaná roboty, tak by jsi to neměl dělat. Co se Ti může stát nejhoršího, tak asi pokud tu stránku budeš zbytečně vytěžovat svým robotem, tak Tě zablokují. Standardně na úrovni blokace IP adresy, případně Tě hodí na nějaký globální blacklist, podle kterého Tě pak bude blokovat větší množství stránek.

Akceptované řešení
+20 Zkušeností
+2,50 Kč
Řešení problému
 
Nahoru Odpovědět
9.6.2018 22:01
Avatar
Jindřich Máca
Tvůrce
Avatar
Odpovídá na Neaktivní uživatel
Jindřich Máca:9.6.2018 22:06

Jinak řečeno, pokud Tvůj robot neumí pracovat s robots.txt, měl by jsi ho to rychle naučit. :-`

Editováno 9.6.2018 22:06
 
Nahoru Odpovědět
9.6.2018 22:06
Avatar
Peter Mlich
Člen
Avatar
Peter Mlich:15.6.2018 13:32

Pokud neco chces zablokovat, tak to udelas pres htaccess. Robots.txt vetsinou slouzi jen pro webove prohlizece.

 
Nahoru Odpovědět
15.6.2018 13:32
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 4 zpráv z 4.