Freitag, der 13. – Die Rache des IT-System

Krass, heute wahr ein waschechter Freitag der 13. Schon am frühen Morgen ging es los als mich der Webserver meines Kunden mit Monitoring Mails über einen Ausfall informierte. Das ganze hat sich dann bis ca. 12:00 Uhr gezogen und ich kam zu NICHTS. Eigentlich wollte ich ganz andere Dinge erledigen, doch es hat wohl nicht sollen sein.

Problem war wohl ein Netzwerkausfall beim Hoster, der die Kiste dann durcheinanderbrachte, gepaart mit dem ansteigenden Traffic ab 7:00 war es der Kiste in Summe dann wohl zu viel. Die Lösung war relativ simple: Das System wurde aus dem Traffic genommen (eine statische Wartungseite wurde angezeigt) bis es sich erholt hatte. Als das Blech dann nicht mehr im Rack vibriert hat, wurde das System wieder in den normalen Betrieb versetzt und schnurrte dann wie ein Kätzchen. Manchmal kann es echt simple sein mit dieser IT.

Lustigerweise bin ich eigentlich der absolute Admin-N00b und habe keine Ahnung wie die Kisten ticken oder kann sie gar administrieren, aber über die Jahre mit Maschinen die unter schwerer Last stehen hat mir dann schon ein paar Kniffe beigebracht – Beispielsweise ging der Webserver von duden.de montags gegen 20 Uhr regelmäßig in die Knie ging und sich niemand erklären konnte warum – bis sich herrausstellte, dass der Traffic immer dann „ausartete“, wenn bei „Wer wird Millionär“ irgendwelche Wörter vorkamen die man erstmal nachschlagen musste (es handelte sich dabei um Peaks von bis zu 300% über dem normalen Traffic), ein wenig Optimierung im Solr der für die Suchfunktion zuständig war half da bereits. Ein anderes Extrem waren die System von KabelBW, die immer schön abrauchten wenn die Bundesliga wieder losging und Sky/Premiere kurz vorher die Keys geändert hatte, man sorgte zwar dafür, dass sie regelmäßiger Verteilt wurden, wer aber seinen Receiver erst kurz vor dem Spiel einschaltete verpasste den Anstoß und musste sich dann natürlich beschweren (Trotz riesen Bannern und Hinweisen auf der Webseite).

Was ich aus dieser Zeit mitgenommen habe? Wenn du deine Peaks kennst, kannst du bereits schon vorher reagieren und dein IT-System schnurrt wie ein Kätzchen.

Ihr möchtet euren Senf zu diesem Artikel beisteuern, oder habt schon ähnliches erlebt? Kommt in die Facebook-Gruppe.