« netage solutions has developed a new boom plug-in to enhance SAP monitoring | Main | Migration eines HP OMU 8 Servers auf einen HP OMU 9 Server »
Montag
Feb062012

Datenschutz auf höchstem Niveau – flexible, plattformübergreifende Server-Überwachung im Bunker!

Das Rechenzentrum Kreuznach (RZKH) ist ein auf die IBM Power-Server spezialisiertes Beratungs- und Dienstleistungs-Unternehmen. Seit den Anfängen der AS/400 immer technologisch auf der Höhe der Zeit, bietet RZKH seinen Kunden neben technischer Beratung auch Unterstützung in Fragen der sicheren Datenverarbeitung. Weiterhin betreibt RZKH viele kleine und mittlere Server von der Arbeitsumgebung für Entwickler über Testumgebungen internationaler Kunden bis zur Archivierung von abgelösten Umgebungen.

 

Seit Mitte 2011 ist RZKH auch physikalisch bestens für den Schutz von Kundendaten vorbereitet. Ein Atomschutz-Bunker aus den 60er Jahren wurde für den Betrieb als Backup-Rechenzentrum umgerüstet und bietet Datenschutz auf höchstem Niveau – aber unter der Erde. Die Wände sind mehrere Meter dick, die Stahltüren halten auch direkte Bombentreffer aus – doch wird dieser Fall hoffentlich nie eintreten. Das Relikt aus dem kalten Krieg eignet sich ideal zur Bewahrung wichtigster Daten auch vor größeren Katastrophen wie Brand, Wasser oder Flugzeug-Abstürzen.

Im Vorfeld der Umzugsphase wurde am Markt nach einer neuen Überwachungslösung für die vielen eigenen sowie Kunden-Server gesucht. Trotz der Fokussierung auf die OS/400-Plattform, kommen im RZKH auch Linux- bzw. Windows-Betriebssysteme unterschiedlicher Distributionen und Versionen zum Einsatz, gepaart mit Applikationen, Verzeichnisdiensten, Webservern usw. Neben der plattformübergreifenden Abdeckung, war ein weiterer wichtiger Punkt der Anforderungen, eine intuitiv nutzbare, grafische Administrationsoberfläche, die es ermöglicht, schnell und zeiteffizient neue Metriken und Anpassungen von zentraler Stelle vornehmen zu können. Darüber hinaus sollten bereits in der Vergangenheit selbst entwickelte  Skripte der existierenden Lösung eine Weiterverwendung in der neuen System-Monitoring-Umgebung finden.

Da annähernd jedes zu überwachende System über eine individuelle Konfiguration sowie besondere Anforderungen an die Verfügbarkeit einzelner Dienste hat, kann eine Lösung „von der Stange“ nicht alle Probleme erkennen, die während des Betriebs auftreten. Gerade bei Archivsystemen kann das baldige Auftreten eines Problems nur durch spezielle Systemmeldungen erkannt werden, da im Gegensatz zu Produktionssystemen nicht ständig aktiv damit gearbeitet wird. Aber im Falle eines Falles kann der Nutzer eben nicht auf eine Problembehebung warten, der Systemverantwortliche erwartet proaktiv eine Meldung über das Auftreten einer Service-Ausnahme. Neben der Anzeige in einer grafischen Oberfläche, war eine weitere Anforderung, entsprechende Fehlermeldungen via E-Mail oder SMS abhängig von Zeitbereich, System und/oder Priorität an verschiedene Personen oder Gruppen weiterzuleiten.

Nach Prüfung und Evaluierung verschiedener am Markt befindlicher Open- und Closed-Source-Lösungen aus dem Bereich System-Management, fiel die Wahl auf boom, den business open operations Manager von netage-solutions. Die Vielzahl der bereits im Standard vorhandenen Templates zum Managen verschiedener Ereignisse, Parameter und Systemwerte,  sowie die flexible Anpassung des Monitoring-Agenten an die besondere, heterogene Kunden-Umgebung überzeugten schnell. Neben den vorgefertigten Konfigurationen ermöglichte das System darüber hinaus, spezifische OS-Kommandos sowie die Ausgabe bereits existierender Skripte zu verwenden. Dadurch konnte der Implementierungsaufwand minimiert werden. Boom unterstützt neben agent-less Monitoring (SNMP, WMI) auch die agent-based-Variante. Unterstützt werden eine Vielzahl an Betriebssystemen, ein installiertes Java-Runtime-Environment der Version 1.5 oder höher vorausgesetzt, gleiches gilt für den boom-Server.

Bereits während des Umzugs der Systeme von der „normalen“ RZ-Umgebung in den Schutzbunker wurden die ersten Systeme in die Überwachung übernommen. Es werden neben Performance-relevanten OS-nahen Daten, auch die wichtigen Informationen über eingesetzte Hardware-Komponenten sowie die Auslastung der WAN-Anbindung gesammelt. Ein weiterer Schwerpunkt liegt bei der Überwachung eingesetzter Applikationen.

Jedem überwachten Element liegt eine Policy mit integrierter Versionsverwaltung zugrunde. Dadurch ist es jederzeit möglich, beispielsweise die aktuellen Schwellenwerte oder Alarmierungstexte mit zeitlich zurückliegenden Konfiguration zu vergleichen bzw. abzugleichen. Die gesammelten Messergebnisse werden DB-unterstützt archiviert und lassen sich für Langzeitanalysen und Trendprognosen weiter verwenden.

Im RZ-Betrieb unterstützt boom prozessorientiert den alltäglichen Ablauf. Bei Service-Ausnahmen stehen dem Operator im boom-GUI Verlinkungen in ein Doku-WIKI mit Dokumentationen und Handlungsanweisungen zur Störungsbeseitigung zur Verfügung. Bei entsprechender Konfiguration hat er die Möglichkeit, statische Programme auf dem überwachten Server-System mit einem Mausklick auszuführen, beispielsweise das Starten eines Webservice für den Fall dass dieser ausgefallen ist – ohne langwieriges Einloggen, Tippfehler usw.

Die Zusammenarbeit mit netage solutions zeichnet sich durch eine schnelle Reaktion sowie das Verständnis für unsere besonderen Anforderungen aus, wodurch der Zeitaufwand für die manuelle Kontrolle der einzelnen Systeme stark reduziert werden konnte.

Holger Scherer, RZKH

Markus Thiel, netage solutions