NOVINKA! E-learningové kurzy umělé inteligence. Nyní AI za nejlepší ceny. Zjisti více:
NOVINKA – Víkendový online kurz Software tester, který tě posune dál. Zjisti, jak na to!

Diskuze: Session / mazání - (10 tisíc/den návštěvnost)

V předchozím kvízu, Online test znalostí PHP, jsme si ověřili nabyté zkušenosti z kurzu.

Aktivity
Avatar
katrincsak
Člen
Avatar
katrincsak:21.11.2016 15:59

Zdravím,

potřeboval bych pomoc najít řešení a nějakou radu.

Server máme na VPS s Ubuntou a každou sekundu se uloží 2 až 4 soubory session. Některé jsou prázdné, ale většina obsahuje nějaká data. V případě, že nedochází k mazání, lze dosáhnout velice rychle několik milionů souborů ve složce a při dosažení jistého limitu souborů dojde k nefunkčnosti serveru.

Potřebuji ale najít řešení jak se zbavit obrovského objemu dat v session. Lze za pomocí cronu ověřovat životnost a mazat session, ale při zvýšeném počtu souborů je to celkem zdlouhavý proces a tím pádem to celkem zatěžuje.

Setkal se někdo s podobným problémem? A jak jste to vyřešili? Nenapadá mě nic co by mohlo řešit problém na straně PHP a nastavení session, třeba platnosti atp, protože soubor jako takový stejně zůstane uložen. Maximálně lze ovlivnit session opakované návštěvy stejného uživatele.

Děkuji za pomoc.

 
Odpovědět
21.11.2016 15:59
Avatar
Neaktivní uživatel:21.11.2016 17:07

V php.ini jsou k dispozici direktivy pro garbage collection.

session.gc_probability 1
session.gc_divisor 100
session.gc_maxlifetime 1440

Všeobecně by si mělo php poradit se zbytečnými session soubory celkem obstojně samo bez nutnosti manuálního zásahu.
Tyhle tři direktivy se dají nastavovat i pomocí ini_set().
V podstatě ve výše uvedeném (výchozím nastavení) se spustí garbage collection jednou ze 100 volání session_start() a označí session soubory starší než 24 minut jako garbage k odstranění.

Nahoru Odpovědět
21.11.2016 17:07
Neaktivní uživatelský účet
Avatar
David Jančík
Vlastník
Avatar
David Jančík:21.11.2016 17:38

Výše zmíněné řešení od Petra je funkční pouze pokud se používá globální tmp složka. Pokud na jednom stroji běží vícero webů, není toho vhodné a používá se pro každý web samostatná tmp složka a v tomto případě už výše uvedené řešení nebude fungovat.

PHP by default nainstaluje do cronu:

/etc/cron.d/php5

Script od Ondřeje Surého, který ale nefunguje, alespoň tedy pro mě ne

/usr/lib/php5/sessionclean

Jako dočasné řešení používám vlastní shell script, který maže soubory, které se po dobu 30 minut nezměnily. To se pak volá ve stejných intervalech jako původní script a je to celkem rychlé. Na serverech se mi generují desítky sessions za vteřinu a neeviduji žádné razantní zpomalení způsobené tímto.

find /var/www/.../tmp -name 'sess_*' -type f -cmin +27 -exec rm {} \;

Pro smazání takto obrovského počtu souborů lze použít následující (rm * apod by se zahltilo a trvalo hrozně dlouho)

ls -f | grep ^sess_ | xargs rm -f

Pokud bys narazil na lepší řešení nebo se ti povedlo zmíněný script od Ondry zprovoznit, budu rád, pokud se podělíš a informuješ mě :)

Nahoru Odpovědět
21.11.2016 17:38
Zapomeň, že je to nemožné a udělej to ;)
Avatar
Odpovídá na David Jančík
Neaktivní uživatel:21.11.2016 17:59

Umíš vysvětlit, proč vy mělo být ls s pipama rychlejší než rm *?

Nahoru Odpovědět
21.11.2016 17:59
Neaktivní uživatelský účet
Avatar
David Jančík
Vlastník
Avatar
Odpovídá na Neaktivní uživatel
David Jančík:21.11.2016 18:49

Deleting millions of files from a directory can be a daunting task. rm -rf will expand the to glob every file in the directory and return an error such as "Argument list too long".

Viz.: http://serverfault.com/…elete/413975

Editováno 21.11.2016 18:55
Nahoru Odpovědět
21.11.2016 18:49
Zapomeň, že je to nemožné a udělej to ;)
Avatar
katrincsak
Člen
Avatar
Odpovídá na Neaktivní uživatel
katrincsak:21.11.2016 19:02

Obávám se, že Ubuntu zrovna s gc pracovat neumí, nebo aspoň co jsem četl. Nevím zda je nutné něco nastavit, nebo provést nějaký update, ale standardně to neumí. Když by tohle fungovalo, bylo by to asi super řešení. Určitě se na to ještě podívám.

 
Nahoru Odpovědět
21.11.2016 19:02
Avatar
katrincsak
Člen
Avatar
Odpovídá na David Jančík
katrincsak:21.11.2016 19:03

Podobný script používám, ale opravdu jen podobný. Ještě se na to také podívám a určitě dám vědět. Když by to provádělo proces rychle a zároveň to nějak znatelně nezatěžovalo server tak to bude dobrým řešením pro svůj účel.

 
Nahoru Odpovědět
21.11.2016 19:03
Avatar
Neaktivní uživatel:22.11.2016 6:34

David Jančík [sczdavos]

Výše zmíněné řešení od Petra je funkční pouze pokud se používá globální tmp složka. Pokud na jednom stroji běží vícero webů, není toho vhodné a používá se pro každý web samostatná tmp složka a v tomto případě už výše uvedené řešení nebude fungovat.

Řešení by mělo fungovat i mimo globální složku. Je nutné nastavit pro každý jednotlivý web session.save_path.


katrincsak:

Obávám se, že Ubuntu zrovna s gc pracovat neumí, nebo aspoň co jsem četl. Nevím zda je nutné něco nastavit, nebo provést nějaký update, ale standardně to neumí.

V Debianu se defaultně php gc vypne a namísto toho se používá cron. Důvod je ten, že z důvodu bezpečnosti má Debian nastavená práva pro defaultní složku se sessions na root:root. Php gc pak do složky nevidí, ale cron běžící pod rootem ano.
Je možné že Ubuntu tuhle vlastnost zdědilo.

Nahoru Odpovědět
22.11.2016 6:34
Neaktivní uživatelský účet
Avatar
katrincsak
Člen
Avatar
katrincsak:22.11.2016 9:53

Petr Linhart:

Děkuji, tohle je celkem důležitá informace a dává to logiku.

Všem děkuji za informace jakmile se opět dostanu k této problematice označím co z toho pomohlo. Samozřejmě zda máte další názory, tak určitě sem s nimi, každý názor se hodí a jakmile budu moct sdělím informaci.

 
Nahoru Odpovědět
22.11.2016 9:53
Děláme co je v našich silách, aby byly zdejší diskuze co nejkvalitnější. Proto do nich také mohou přispívat pouze registrovaní členové. Pro zapojení do diskuze se přihlas. Pokud ještě nemáš účet, zaregistruj se, je to zdarma.

Zobrazeno 9 zpráv z 9.