Diskuze: Hodně automatizovaných requestů na web - porušuji něco?
Člen
Zobrazeno 18 zpráv z 18.
//= Settings::TRACKING_CODE_B ?> //= Settings::TRACKING_CODE ?>
Požadavků není takové množství aby se dalo mluvit o nějakém DOS útoku
Pokud provozovatel webu ten provoz vyhodnotí jako útok, tak tvůj názor na to zda to útok byl či nebyl je až na posledním místě.
Proč se nedohodnout s provozovatlem? Prasit to přes parsování to největší zlo. Navíc pokud to děláš takto a jak píšeš stahuješ data která mají cenu, tak se dopouštíš dalších přečinů, + ve tvém příspěvku ještě vidím navádění ostatních (pokud bych to dotáhl ad absurdum).
100 000 requestů za jaký časový úsek? Hodina, den?
Těch 100 000 requestů je přibližně v jednom dni. Přičemž je to jednorázová záležitost. - tak se to dá i rozložit no.
Mám své dobré důvody, proč to dělám takto. Není to předmětem této
diskuze.
(a nejsou to žádná choulostivá data, ani je nehodlám rozprodávat, či na
nich provozovat nelegální činnosti)
Tzn request za sekundu po dobu 24 hodin.. To je hodně.
Tvoje důvody jsou nepodstatné, stejně jako je nepodstatné to jak s těmi
daty budeš nakládat.
V naší banánové republice, kde uloz.to nabízí volně ke stažení ilegální obsah ti nikdo asi nic neudělá. Právně je to IMHO ok, pokud ti neprokáže že jsi mu způsobil vyšší zátěží škodu nebo pokud tam nemají interní pravidla, která toto zakazují. Morálně to je fakt sviňárna a není problém si tě podle IP adresy najít (poskytovatel tvého připojení jim sdělí tvé údaje, protože od něj přišla enormní zátěž). Je to asi jako by jsi se ptal jestli něco porušuješ když se někomu vyspíš s ženskou...
Ok.
Důvody sem nepíšu, protože se hájím, ale protože ses ptal.
A samozřejmě chápu, že to není dobré řešení.
Před pár lety jsem přes wget zkoušel vytáhnout obsah mailing listů bugtraq a full-disclosure (myslím, že je to server seclists.org). Skončilo to na cca čtvrt roku zablokovanou IP adresou (nakonec jsem přiešel na to, že když wget stahuje každé 4 s jednu stránku, tak je to ještě OK, ale menší interval už ne).
Jinak celkem souhlasím s tím, co tady již bylo řečeno. Pokud svým počínáním nezpůsobíš škodu, tak se asi právně nemáš moc čeho bát (nepokoušíš-li se třeba o neautorizovaný přístup). Myslím, že situace by mohla být jiná, pokud bys např. systematicky vykradl obsah eshopu. Ale moc se v těchto otázkách nevyznám.
Uloz.to funguje trochu jinak, prý je pod ochranou země, ke které patří přípona .to (asi někde v Africe), takže na něj neplatí naše zákony.
EDIT: David Hartinger - zrovna tobě už jsem to říkal na jednom srazu
To se mi nezdá, provozuje ho česká firma, pochybuji o tom, že tě koncovka nějak právně ochrání. Můžeš to nějak doložit?
Koncovka nemá na lokalitu uplatnění práv vůbec vliv. Pokud je firma založená a registrovaná v Česku, tak na ni platí české zákony. To, že mají takovou doménu je podle mě spíš forma určitého "SWAGu" a vyloučení parazitování na podobných doménách jako ulozto(dot)cz.
Doložit to nemůžu, informaci mám od člověka, který u nás na škole před 2 lety byl jako praktikant - učil zeměpis.
Všude je spousta vševědů co se vyjadřují k věcem o kterých neví zhola nic, je důležité fakta ověřovat, zvlášť už od pohledu takovejhle nesmysl.
Netuším, jak ulož.to může být pod ochranou Tonga, určitě ne kvůli tomu že mají jejich koncovku, nehledě na to že právní ochrana agrární soustavy ostrovů kdesi v oceánii není zrovna moc velká páka.
Samotná doména ani žádnou ochranu poskytovat nemůže, vzhledem k tomu že Tonga má jen minimální vliv na své domény.
Ještě k tomu co bylo psaný výše, jednání tazatele není pouze nemorální.
A firma nemusí být založená v česku aby byla českým právem postihnutelná, kdokoliv tu má jakékoliv aktivity, musí se přizpůsobit místním podmínkám a je jedno jestli je to čech, rus nebo marťan.
Btw. čistě ze zvědavosti. Co má být záměrem tvého jednání? Nemusíš psát konkrétně(když jsi psal, že to není záměrem diskuse), pouze nějak obecně k čemu je to vůbec dobré? Myslím, že mám s weby i využíváním dat z jiných webů nějaké zkušenosti, ale prostě si naprosto nedokážu představit k čemu by mohla sloužit jednorázové vybombardování jednoho webu jeden den každou vteřinu.
No, záměrem není to vybombardovat během dne. Jenom to mám teď tak
nastavené, samozřejmě se to dá upravit.
Záměrem tedy je dostat z toho kýžená data, která mi přijdou zajímavá
pro statistické zpracování.
Nakonec se mi otevřela ještě trochu jiná cesta, takže parsovací řešení
si nechám v záloze a místní specialisté na české právo budou mít
klidnější spaní.
Plánuji vytvořit stránku s podobným principem akorát bude mít míň požadavků na web (cca asi 80 000 za den - zhruba 50 dotazů každých 5 minut). Budu si stahovat obsah, který dál budu zprostředkovávat na svém webu. Díval jsem se na jejich podmínky a nikde nemají nic podobného zakázáno. Porušuji tím tedy něco?
Myslím si, že porušovat klidně můžeš. A nemusí to mít nikde v podmínkách napsané. Např. pokud by se jednalo o nějakou formu autorského díla, tak by na tvé počínání mohlo být nahlíženo na jeho užití v rozporu s licencí. "Zprostředkování obsahu" může být třeba i kopírování článků slovo od slova.
Myslím, že u nás byl i soudně řešen případ, kdy někdo vytahoval informace z cizího webu (myslím, že šlo o videa), aby nebylo nutné se tímto cizím webem proklikávat a hledat je tam. A problém byl hlavně v tom, že kvůli tomu potenciální návštěvník neviděl/neproklikal zobrazované reklamy.
Ono i kdyby to právně v pořádku bylo, tak je lepší se u tohoto typu věcí, které nejsou na první pohled zřejmé, dohodnout s provozovatelem. Už proto, že tím můžeš předejít různým problémům, i když budeš v právu.
Co se týče staršího obsahu, uloz.to sice nelegální obsah obsahuje, ale mělo by mít povinnost jej mazat, dyž jej na něj upozorníš. Kdesi je totiž zakotveno, že není v silách provozovatele hlídat, který obsah je legální a který ne (což mi přijde logické). Pokud vím, mají větší hráči (Dilia...) i speciální přístup na uloz.to. Podobně to řeší Youtube (tam navíc mají algoritmy na detekci podobnosti, které by měly (podle tvrzení lidí ze švýcarské pobočky někdy z r. 2013) odhalit pokus o nahrání nelegálního videa (které má Google v databázi) od délky 30 s.
Děkuji za názory. Nevím, jestli by se jednalo o porušování autorského díla, když na web může přispívat jakýkoliv návštěvník. Ale máte pravdu, že by bylo lepší udělat to, co jsem chtěl udělat i předtím. Nejdřív se domluvit s majitelem webové stránky.
Zobrazeno 18 zpráv z 18.