Ausfall Webhosting-Pakete
Incident Report for lima-city Webspace
Resolved
Das Problem ist behoben. Die Monitoring-Problematik ist geklärt, wir haben also derzeit noch die technische, an der wir arbeiten. Dies wird mehrere Tage oder Wochen dauern, da wir dies ebenfalls mit einem Drittanbieter koordinieren müssen.
Posted about 2 months ago. Oct 23, 2018 - 17:19 CEST
Monitoring
Im Zeitraum von 7:03 bis ca. 13:00 gab es ein unentdecktes Problem im PHP-FPM-Service (der Server-Service von PGHP) auf einem der Webspace-Server, welches zu einer Endlosschleife von Restarts einzelner Kunden-PHP-Prozess-Pools geführt hat.

Im Normalfall wäre dieses Problem innerhalb von Minuten von Monitoring gemeldet, eskaliert und gelöst worden. Wir haben festgestellt, dass unser Monitoring-Provider _alle_ Kontakte deaktiviert hat und das Problem zwar beobachtet, aber an niemanden weitergeleitet hat.

Wir versuchen nun herauszufinden, was das Problem bei unserem Monitoring-Provider ist. Die Kontakte wurden bereits manuell wieder aktiviert. Der Ausfall ist eindeutig durch diesen Fehler bei unserem Monitoring-Provider ausgelöst.
Posted about 2 months ago. Oct 23, 2018 - 14:23 CEST