Avatar
lars
Člen
Avatar
lars:

narazil jsem na zabezpečení webové stránky firmy.cz/detail
při použítí curl se stránka stáhne a zobrazí jen znaky něco jako: �b7�W��=�n�ȕ�­�WTz�d��d_e���lO�ز`yf�A5­Yꦛd1$��V

zkoušel jsem si hrát si s nastavením kodování, změnou useragenta nic nepomáhá.
zajímá mě jakou metodou dokázali zabezpečit web proti scrapování a jak se dá takhle metoda rozšifrovat díky.

můj php kód

<?php

$ch = curl_init();
curl_setopt($ch, CURLOPT_FOLLOW­LOCATION, true);
curl_setopt($ch, CURLOPT_AUTORE­FERER, true);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704­.103 Safari/537.36');
curl_setopt($ch, CURLOPT_SSL_VE­RIFYPEER, false);
curl_setopt($ch, CURLOPT_PROXYTYPE, CURLPROXY_SOCKS5);
curl_setopt($ch, CURLOPT_PROXY, "127.0.0.1");
curl_setopt($ch, CURLOPT_PROXYPORT, 9150);
curl_setopt($ch, CURLOPT_URL, 'https://www.fir­my.cz/detail/643158-auto-moto-centrum-petracek-usti-nad-orlici.html?_es­caped_fragmen­t_=');
curl_setopt($ch, CURLOPT_RETUR­NTRANSFER, TRUE);

$data = curl_exec($ch);
echo $data;

?>

 
Odpovědět  +1 16. července 3:26
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 1 zpráv z 1.