Problem

Dešava da web aplikacija vrlo često puca (ne može da prođe ni sat vremena). Nakon pucanja samo se ponovo uloguje i sve radi OK, ali opet nakon kraćeg vremena web aplikacija ponovo pukne.

Ovo se tipično dešava ako se MERA resetuje kao posledica interne provere. Interna provera je:

  • da li se pozdravna stranica otvorila za 10 (ili 20 sekundi)
  • da li u sistemu postoji više od N stuck monitora (o ovome nešto kasnije)
    Ukoliko je postoji problem u vezi sa bilo kojom od gornje dve situacije, MERA se resetuje.
  • Fajl sa kojim se restartuje aplikacija,odnosno monitor jeste /home/netiis/bin/restart_mera.sh .

Dijagnostika

Poslati catalina.out (ceo, ne samo poslednjih 100 linija) kao i /home/netiis/bin/provera.log

Rešenje

U zavisnosti od uzroka, ali tipično dodavanje više procesorske snage; ponekad pomaže tweak-ovanje nekih internih parametara MERE.

Stuck monitori
Svaki monitor mora da se izvrši u zadatom vremenskom periodu. Npr. monitor za proveru temperature chillera klime more da se izvrši jednom na svakih 2 minuta. Zbog problema (hardversko/softverskih, zagušenje sistema) može da se dogodi da se monitor ne izvrši u zadatom periodu već tek posle 4 ili više minuta. Ukoliko veći broj monitora (deset ili više) počne da kasni sistem postaje nepouzdan. Pokazalo se da reset sistema obezbedi normalno funkcionisanje u nekom kraćem vremenskom periodu (sat, dan, možda nekoliko dana, nikad više od toga). Ako se ne otkloni uzrok zagušenja sistema, neminovno je da će sistem povremeno da se resetuje usled povećanja ovih "zakasnelih" ili "stuck" monitora.