Halloweenská akce! Na stránce s dobitím bodů zadej dole kód STRASIDELNYCH20 a získej porci +20% bodů zdarma!
Akce končí 31.10. o půlnoci.

Diskuze: List všech sub adres

Python Python List všech sub adres American English version English version

Aktivity (1)
Avatar
Luboš Hnědý:1. července 15:29

Potřeboval bych pomocí pythonu načíst všechny sub adresy a moc nevím jak. Jde mi o to, že mám například adresu www.test.cz/obed a potřeboval bych načíst všechny podadresy. například www.test.cz/obed/svickova, www.test.cz/obed/rajska atd. Předem děkuji za odpovědi. :)

Zkusil jsem: Hledat na internetu a nic konkrétního se mi nepovedlo najít.

Chci docílit: Načíst adresy z nějaké jiné adresy.

 
Odpovědět 1. července 15:29
Avatar
Jindřich Máca
Tým ITnetwork
Avatar
Odpovídá na Luboš Hnědý
Jindřich Máca:1. července 16:59

Ahoj, asi chápu co chceš udělat. Celá pointa spočívá v tom, že ty sub-adresy musíš mít možnost odněkud získat. Např. na té adrese www.test.cz/obed se nachází webová stránka, kde je uveden seznam těch jídel a odkazů na ně. Pak je jasné, že k jejich získání musíš tu webovou stránku stáhnout a vyparsovat je z onoho HTML. Bohužel nějaký úplně obecný postup není a pokud např. ta sub-adresa není nikde uvedená, tak se k ní zkrátka nedostaneš.

Akceptované řešení
+20 Zkušeností
+1 bodů
Řešení problému
 
Nahoru Odpovědět 1. července 16:59
Avatar
Odpovídá na Jindřich Máca
Luboš Hnědý:2. července 11:33

Děkuji za odpověď. Takhle mě to taky napadlo, ale říkal jsem si, že ta stránka musí mít určitě ty adresy někde "registrovaný". V tom případě to udělám asi takhle no. To bude pěkná piplačka. Nicméně díky

 
Nahoru Odpovědět 2. července 11:33
Avatar
Jindřich Máca
Tým ITnetwork
Avatar
Odpovídá na Luboš Hnědý
Jindřich Máca:2. července 12:42

Není zač, jde právě o to, že žádný takový register obecně není. Některé stránky mívají soubor sitemap.xml, tak se ještě můžeš zkusit podívat, jestli ho ta Tvoje vybraná má a jestli to nějak pomůže. ;-)

 
Nahoru Odpovědět 2. července 12:42
Avatar
Daniel Vítek
Tým ITnetwork
Avatar
Odpovídá na Jindřich Máca
Daniel Vítek:4. července 8:27

Případně můžeš "brutalforce" házet GETy a kontrolovat který nevyhodí 404 :D Ale to by asi provozovatel webu nebyl moc rád a chvíli by to zabralo :D

Nahoru Odpovědět  +1 4. července 8:27
Na síti působím už pěknou řádku let. Pokud budeš něco potřebovat, písni mi, pokusím se ti poradit :)
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 5 zpráv z 5.