Avatar
Matěj Strnad:4. července 12:08

Jak mám udělat Web crawlera v PHP? P.S vím že na to PHP není moc dobrý jazyk a klidně mě doporučte jiný jazyk který jde spustit na VPS :D

Chci docílit: Web crawlera? :D

Odpovědět  ±0 4. července 12:08
Ty vaše internety!
Avatar
Matěj Strnad:4. července 14:09

To co on tam ukazuje se mě nezdá jako efektivní robot na to aby měl denně projít tisíce webů, on to ukazuje spíš jen tak pro srandu a moc jsem nepochopil co tam dělá a to nejsem v PHP začátečník ;)

Nahoru Odpovědět 4. července 14:09
Ty vaše internety!
Avatar
Jindřich Máca
Tým ITnetwork
Avatar
Odpovídá na Matěj Strnad
Jindřich Máca:4. července 15:02

To je právě ono. Myslím, že efektivní web crawler se dá napsat i v PHP, ale musíš vědět, co přesně děláš. :)

Každopádně, když jsme třeba psali takovéto nástroje ve škole (FIT ČVUT) přímo v předmětu "dolování dat z webu", tak jsme používali Python a v kombinaci s příslušnými frameworkem, jako např. Scrapy, by kvalitní crawler za hodinku až dvě hotový. :-`

 
Nahoru Odpovědět 4. července 15:02
Avatar
Matěj Strnad:4. července 15:31

Já jsem spíš pro PHP protože ho docela "umím" :)

Nahoru Odpovědět 4. července 15:31
Ty vaše internety!
Avatar
Odpovídá na Matěj Strnad
Tomáš Martin Holub:4. července 18:32

No , pokud chceš projít tisíce webů tak nevím jestli ti to server utáhne :)

 
Nahoru Odpovědět  ±0 4. července 18:32
Avatar
Odpovídá na Tomáš Martin Holub
Matěj Strnad:4. července 18:35

Myslíš že mě toto pomůže k tvorbě Web crawlera?

Nahoru Odpovědět 4. července 18:35
Ty vaše internety!
Avatar
Odpovídá na Matěj Strnad
Tomáš Martin Holub:4. července 18:36

Částečně ano

 
Nahoru Odpovědět  +1 4. července 18:36
Avatar
gold604
Člen
Avatar
gold604:5. července 14:10

Skúsil by som kľudne aj node.js :)

 
Nahoru Odpovědět 5. července 14:10
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 9 zpráv z 9.