Avatar
Lako
Člen
Avatar
Lako:

Ahoj.
Z nějakého důvodu potřebuji na cizí web automatizovaně posílat requesty.
Je takováto činnost legální? Požadavků není takové množství aby se dalo mluvit o nějakém DOS útoku (celkem asi 100 000). Je to web, který má návštěvnost tak 1500 denních unikátů..

(kdyby se někdo ptal proč to dělám - tak ano- sbírám z toho webu data, která pro mě mají hodnotu)

A ještě jedna věc: Kdyby ste chtěl někdo s něčím podobným pomoct, tak celou aplikaci vyvíjím v c# za pomoci htmlagilitypacku -( https://htmlagilitypack.codeplex.com/ ), takže můžu v lecčem poradit.

Děkuji za příspěvky.

 
Odpovědět 5.6.2015 22:06
Avatar
Richard
Člen
Avatar
Odpovídá na Lako
Richard:
Požadavků není takové množství aby se dalo mluvit o nějakém DOS útoku

Pokud provozovatel webu ten provoz vyhodnotí jako útok, tak tvůj názor na to zda to útok byl či nebyl je až na posledním místě.

Proč se nedohodnout s provozovatlem? Prasit to přes parsování to největší zlo. Navíc pokud to děláš takto a jak píšeš stahuješ data která mají cenu, tak se dopouštíš dalších přečinů, + ve tvém příspěvku ještě vidím navádění ostatních (pokud bych to dotáhl ad absurdum).

100 000 requestů za jaký časový úsek? Hodina, den?

Nahoru Odpovědět  +6 5.6.2015 22:19
$action = $_GET['Life']; | Když dáš mínus, napiš proč!
Avatar
Lako
Člen
Avatar
Odpovídá na Richard
Lako:

Těch 100 000 requestů je přibližně v jednom dni. Přičemž je to jednorázová záležitost. - tak se to dá i rozložit no.

Mám své dobré důvody, proč to dělám takto. Není to předmětem této diskuze.
(a nejsou to žádná choulostivá data, ani je nehodlám rozprodávat, či na nich provozovat nelegální činnosti)

 
Nahoru Odpovědět 5.6.2015 22:30
Avatar
Richard
Člen
Avatar
Odpovídá na Lako
Richard:

Tzn request za sekundu po dobu 24 hodin.. To je hodně.
Tvoje důvody jsou nepodstatné, stejně jako je nepodstatné to jak s těmi daty budeš nakládat.

Nahoru Odpovědět  +3 5.6.2015 22:35
$action = $_GET['Life']; | Když dáš mínus, napiš proč!
Avatar
David Čápka
Tým ITnetwork
Avatar
Odpovídá na Lako
David Čápka:

V naší banánové republice, kde uloz.to nabízí volně ke stažení ilegální obsah ti nikdo asi nic neudělá. Právně je to IMHO ok, pokud ti neprokáže že jsi mu způsobil vyšší zátěží škodu nebo pokud tam nemají interní pravidla, která toto zakazují. Morálně to je fakt sviňárna a není problém si tě podle IP adresy najít (poskytovatel tvého připojení jim sdělí tvé údaje, protože od něj přišla enormní zátěž). Je to asi jako by jsi se ptal jestli něco porušuješ když se někomu vyspíš s ženskou...

Akceptované řešení
+20 Zkušeností
Řešení problému
Nahoru Odpovědět  +8 5.6.2015 22:46
Miluji svou práci a zdejší komunitu, baví mě se rozvíjet, děkuji každému členovi za to, že zde působí.
Avatar
Lako
Člen
Avatar
Odpovídá na Richard
Lako:

Ok.
Důvody sem nepíšu, protože se hájím, ale protože ses ptal.
A samozřejmě chápu, že to není dobré řešení.

 
Nahoru Odpovědět  -3 5.6.2015 22:53
Avatar
Martin Dráb
Redaktor
Avatar
Odpovídá na Lako
Martin Dráb:

Před pár lety jsem přes wget zkoušel vytáhnout obsah mailing listů bugtraq a full-disclosure (myslím, že je to server seclists.org). Skončilo to na cca čtvrt roku zablokovanou IP adresou (nakonec jsem přiešel na to, že když wget stahuje každé 4 s jednu stránku, tak je to ještě OK, ale menší interval už ne).

Jinak celkem souhlasím s tím, co tady již bylo řečeno. Pokud svým počínáním nezpůsobíš škodu, tak se asi právně nemáš moc čeho bát (nepokoušíš-li se třeba o neautorizovaný přístup). Myslím, že situace by mohla být jiná, pokud bys např. systematicky vykradl obsah eshopu. Ale moc se v těchto otázkách nevyznám.

Nahoru Odpovědět  +4 6.6.2015 0:31
2 + 2 = 5 for extremely large values of 2
Avatar
Zdeněk Pavlátka
Tým ITnetwork
Avatar
Odpovídá na David Čápka
Zdeněk Pavlátka:

Uloz.to funguje trochu jinak, prý je pod ochranou země, ke které patří přípona .to (asi někde v Africe), takže na něj neplatí naše zákony.

EDIT: David Čápka - zrovna tobě už jsem to říkal na jednom srazu

Editováno 6.6.2015 7:06
Nahoru Odpovědět  -5 6.6.2015 7:05
Kolik jazyků umíš, tolikrát jsi programátor.
Avatar
David Čápka
Tým ITnetwork
Avatar
Odpovídá na Zdeněk Pavlátka
David Čápka:

To se mi nezdá, provozuje ho česká firma, pochybuji o tom, že tě koncovka nějak právně ochrání. Můžeš to nějak doložit?

Nahoru Odpovědět  +1 6.6.2015 9:38
Miluji svou práci a zdejší komunitu, baví mě se rozvíjet, děkuji každému členovi za to, že zde působí.
Avatar
tomasmanhal
Člen
Avatar
Odpovídá na Zdeněk Pavlátka
tomasmanhal:

Koncovka nemá na lokalitu uplatnění práv vůbec vliv. Pokud je firma založená a registrovaná v Česku, tak na ni platí české zákony. To, že mají takovou doménu je podle mě spíš forma určitého "SWAGu" a vyloučení parazitování na podobných doménách jako ulozto(dot)cz.

Editováno 6.6.2015 10:10
Nahoru Odpovědět 6.6.2015 10:09
Kdyby nám dodali k životu zdrojový kód, vše by bylo jednodušší...
Avatar
Zdeněk Pavlátka
Tým ITnetwork
Avatar
Odpovídá na David Čápka
Zdeněk Pavlátka:

Doložit to nemůžu, informaci mám od člověka, který u nás na škole před 2 lety byl jako praktikant - učil zeměpis.

Nahoru Odpovědět 6.6.2015 10:38
Kolik jazyků umíš, tolikrát jsi programátor.
Avatar
Richard
Člen
Avatar
Odpovídá na Zdeněk Pavlátka
Richard:

Všude je spousta vševědů co se vyjadřují k věcem o kterých neví zhola nic, je důležité fakta ověřovat, zvlášť už od pohledu takovejhle nesmysl.

Netuším, jak ulož.to může být pod ochranou Tonga, určitě ne kvůli tomu že mají jejich koncovku, nehledě na to že právní ochrana agrární soustavy ostrovů kdesi v oceánii není zrovna moc velká páka.

Samotná doména ani žádnou ochranu poskytovat nemůže, vzhledem k tomu že Tonga má jen minimální vliv na své domény.

Ještě k tomu co bylo psaný výše, jednání tazatele není pouze nemorální.

A firma nemusí být založená v česku aby byla českým právem postihnutelná, kdokoliv tu má jakékoliv aktivity, musí se přizpůsobit místním podmínkám a je jedno jestli je to čech, rus nebo marťan.

Nahoru Odpovědět  +2 6.6.2015 12:49
$action = $_GET['Life']; | Když dáš mínus, napiš proč!
Avatar
Pavol Hejný
Redaktor
Avatar
Odpovídá na Lako
Pavol Hejný:

Btw. čistě ze zvědavosti. Co má být záměrem tvého jednání? Nemusíš psát konkrétně(když jsi psal, že to není záměrem diskuse), pouze nějak obecně k čemu je to vůbec dobré? Myslím, že mám s weby i využíváním dat z jiných webů nějaké zkušenosti, ale prostě si naprosto nedokážu představit k čemu by mohla sloužit jednorázové vybombardování jednoho webu jeden den každou vteřinu.

Nahoru Odpovědět 6.6.2015 23:54
http://pavolhejny.cz/
Avatar
Lako
Člen
Avatar
Odpovídá na Pavol Hejný
Lako:

No, záměrem není to vybombardovat během dne. Jenom to mám teď tak nastavené, samozřejmě se to dá upravit.
Záměrem tedy je dostat z toho kýžená data, která mi přijdou zajímavá pro statistické zpracování.
Nakonec se mi otevřela ještě trochu jiná cesta, takže parsovací řešení si nechám v záloze a místní specialisté na české právo budou mít klidnější spaní.

 
Nahoru Odpovědět 7.6.2015 11:43
Avatar
martin21000
Člen
Avatar
martin21000:

Plánuji vytvořit stránku s podobným principem akorát bude mít míň požadavků na web (cca asi 80 000 za den - zhruba 50 dotazů každých 5 minut). Budu si stahovat obsah, který dál budu zprostředkovávat na svém webu. Díval jsem se na jejich podmínky a nikde nemají nic podobného zakázáno. Porušuji tím tedy něco?

 
Nahoru Odpovědět 27. června 13:00
Avatar
Odpovídá na martin21000
Petr Čech (czubehead):

Dohodni se s daným webem, to je nejlepší

Nahoru Odpovědět  +1 27. června 14:48
Why so serious? -Joker
Avatar
Martin Dráb
Redaktor
Avatar
Odpovídá na martin21000
Martin Dráb:

Myslím si, že porušovat klidně můžeš. A nemusí to mít nikde v podmínkách napsané. Např. pokud by se jednalo o nějakou formu autorského díla, tak by na tvé počínání mohlo být nahlíženo na jeho užití v rozporu s licencí. "Zprostředkování obsahu" může být třeba i kopírování článků slovo od slova.

Myslím, že u nás byl i soudně řešen případ, kdy někdo vytahoval informace z cizího webu (myslím, že šlo o videa), aby nebylo nutné se tímto cizím webem proklikávat a hledat je tam. A problém byl hlavně v tom, že kvůli tomu potenciální návštěvník neviděl/neproklikal zobrazované reklamy.

Ono i kdyby to právně v pořádku bylo, tak je lepší se u tohoto typu věcí, které nejsou na první pohled zřejmé, dohodnout s provozovatelem. Už proto, že tím můžeš předejít různým problémům, i když budeš v právu.

Co se týče staršího obsahu, uloz.to sice nelegální obsah obsahuje, ale mělo by mít povinnost jej mazat, dyž jej na něj upozorníš. Kdesi je totiž zakotveno, že není v silách provozovatele hlídat, který obsah je legální a který ne (což mi přijde logické). Pokud vím, mají větší hráči (Dilia...) i speciální přístup na uloz.to. Podobně to řeší Youtube (tam navíc mají algoritmy na detekci podobnosti, které by měly (podle tvrzení lidí ze švýcarské pobočky někdy z r. 2013) odhalit pokus o nahrání nelegálního videa (které má Google v databázi) od délky 30 s.

Nahoru Odpovědět  +1 27. června 15:19
2 + 2 = 5 for extremely large values of 2
Avatar
martin21000
Člen
Avatar
martin21000:

Děkuji za názory. Nevím, jestli by se jednalo o porušování autorského díla, když na web může přispívat jakýkoliv návštěvník. Ale máte pravdu, že by bylo lepší udělat to, co jsem chtěl udělat i předtím. Nejdřív se domluvit s majitelem webové stránky.

 
Nahoru Odpovědět 27. června 16:02
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 18 zpráv z 18.