Remote-Management vereinfacht die Administration dezentraler IT-Infrastrukturen, reduziert Kosten und erhöht die Verfügbarkeit auch entfernter Server durch frühzeitiges Erkennen und schnelle Diagnose von Systemfehlern. Ausfallzeiten und Servicekosten lassen sich minimieren, da erfahrungsgemäß rund die Hälfte der auftretenden Probleme ohne Ersatzteile zu lösen sind und kostenaufwändige Vor-Ort-Einsätze damit entfallen.
Das Remote-Management umfasst den gesamten Lebenszyklus der Server – von der ersten Installation
und nachfolgenden Updates über das Asset-Management bis hin zur Überwachung, Steuerung und
Fehlerbehebung. Die Administratoren können damit vom eigenen, entfernten Arbeitsplatz aus
beispielsweise die Server in den Filialen installieren, Inventarüberprüfungen und Updates
durchführen oder die Performance kontinuierlich überwachen. Zudem sind sie in der Lage, bei
Störungen Diagnosen zu stellen, die Systemeinstellungen zu korrigieren oder remote einen Neustart
durchzuführen. In der Regel stehen zusätzlich eigenständige Hardwarebausteine zur Verfügung, die
selbst beim Ausfall des Betriebssystems oder von Hardwaremodulen noch Informationen an den
Administrator senden.
Um von Anfang an ein korrekt installiertes und stabiles System zu gewährleisten, müssen die
Routinen zur Inbetriebnahme beziehungsweise zum Setup der Server eine hohe Qualität aufweisen.
Gleichzeitig ist ein Zeit und Kosten sparendes Rollout gefragt. Eine entsprechende
Remote-Installationssoftware leistet hier wertvolle Hilfe. So werden die Konfigurationsdaten für
den kompletten Installationsprozess gespeichert – inklusive der Ausführung individueller Skripte
oder der Installation von Anwendungssoftware. Die im Allgemeinen Wizard-gestützte Software erkennt
selbstständig die zu konfigurierenden Hardwarekomponenten und stellt automatisch die notwendigen
Tools und Treiber bereit. Plausibilitätschecks sorgen zudem für die richtigen
Installationssequenzen.
Die Remote-Installation lässt sich für einzelne oder auch mehrere gleichartige Server anhand der
Konfigurationsdaten vollautomatisiert über das Netzwerk durchführen. Der Ablauf kann somit ohne
zusätzliche manuelle Eingriffe auf weitere identische Server übertragen werden. Darüber hinaus
unterstützt eine entsprechende Software auch parallele Remote-Masseninstallationen einer größeren
Anzahl gleichartiger Server (Klonen). Hierzu werden aus den Boot-Images fertiger Installationen so
genannte Master-Images generiert, die sich auf einem beliebigen Fileserver im Netzwerk speichern
lassen. Ist die Netzinfrastruktur entsprechend ausgeprägt – zum Beispiel durch die Unterstützung
von Multicast-Technologie – kann der Administrator die Image-Kopien parallel an mehrere Server
senden, was insbesondere beim Aufbau von Serverfarmen mit hunderten von Rackservern zu drastischen
Zeiteinsparungen führt.
Die Wartung der Hardware bedeutet für Systemadministratoren einen großen Aufwand, da alle
Abhängigkeiten zwischen den verschiedenen Versionen von Betriebssystemen, Systemtreibern und
Firmware konsistent zu halten sind. Voraussetzung für ein effizientes Handling ist ein umfassendes
Asset-Management. Entsprechende Software ermittelt, welche Server mit welcher Ausstattung vorhanden
sind. Sie analysiert die Konfigurationen wie Firmware- und BIOS-Stände sowie Treiberversionen und
schlägt, falls erforderlich, Updates vor. Zudem prüft die Software automatisch die Abhängigkeiten
zwischen den verschiedenen Komponenten, leitet den Administrator zu den benötigten
Download-Ressourcen für die betreffenden Server und stellt Funktionen für die Remote-Installation
bereit. Alle Systemänderungen lassen sich über die gesamte Nutzungszeit dokumentieren und
archivieren. Der Administrator erhält dadurch nicht nur jederzeit eine detaillierte Übersicht über
das momentane Inventar, bei Störungen kann er durch einen Vergleich der Archivdaten auch
überprüfen, ob die Probleme eventuell auf Änderungen am Filesystem oder in der
Hardwarekonfiguration zurückzuführen sind.
Das Monitoring überwacht mittels so genannter Agenten alle Hardwarekomponenten und ermittelt
detaillierte Informationen über Bussysteme, Prozessoren, Hauptspeicher, Festplatten und Controller
sowie über die Performance und Auslastung der Server. Um die Leistung und Verfügbarkeit der Server
sicherzustellen, kann der Administrator mithilfe von Regeln und Filtern zentral für alle
Komponenten beziehungsweise Instanzen Schwellenwerte definieren. Diese bestimmen, wann und wie ein
Ereignis (Event) ausgelöst wird und welche Aktionen dieses anstößt. Beim Überschreiten der vorher
festgelegten Schwellenwerte oder beim Auftreten eines Fehlers alarmiert das System den
Administrator automatisch, beispielsweise über SMS oder E-Mail.
Sämtliche Informationen und Systemzustände werden beispielsweise aktuell von der entsprechenden
Monitoring-Software aufbereitet und in grafischer Form zur Verfügung gestellt. Durch Mausklick auf
ein Server-Icon lässt sich auf einfache Weise der detaillierte Status des Servers, seiner
Subsysteme und des Betriebssystems ermitteln. Im Rahmen so genannter PDA-Konzepte (Prefailure
Detection and Analysis) erkennen und melden die Agenten auch Verschleißerscheinungen an Lüftern,
CMOS-Batterien, Speichermodulen, CPUs sowie an Festplatten die über SCSI- und RAID-Controllern
angeschlossen sind. Administratoren können dann dafür sorgen, dass die betroffenen Komponenten
ausgetauscht werden, bevor sie Schaden anrichten. Da viele Bausteine wie Lüfter oder Netzteile
meistens redundant vorhanden sind, ist ein Wechsel im laufenden Betrieb möglich.
Fällt bei einem Server zum Beispiel eine CPU oder ein komplettes Speichermodul aus, leitet das
Remote-Management mit ASR&R (Automatic Server Reconfiguration and Restart) ein intelligentes
Fehlermanagement ein: Hierbei findet ein automatischer Neustart des Servers statt, wobei die
fehlerhafte Komponente aus der Konfiguration entfernt wird. Gleichzeitig benachrichtigt die Lösung
selbstständig den Administrator, damit dieser das schadhafte Bauteil gelegentlich austauscht.
Beim Komplettausfall eines Servers, kann der Administrator nicht mehr über das primäre lokale
Netz auf den Server zugreifen. Dann tritt das in die Serverhardware integrierte Service-Board in
Aktion und bietet als autonomes System im überwachten Server dem Administrator seine Dienste an.
Dieser kann zunächst remote den Server via Service-Board aus- und wieder einschalten. In vielen
Fällen genügt dies, um das System erneut hochzufahren und die Betriebsbereitschaft
wiederherzustellen. Sollte der Server auch nach dem Aus- und Wiedereinschalten nicht booten, kann
der Administrator eine gezielte Diagnose und Fehlerbehebung einleiten. Selbst wenn ein
Vor-Ort-Einsatz unumgänglich ist, hilft hier das Remote-Management, die Kosten gering zu halten und
die Ausfallzeiten zu minimieren, da sich mögliche Fehlerursachen bereits im Vorfeld ermitteln oder
ausschließen lassen. Servicefachleute wissen dadurch, welche konkreten Arbeitsschritte notwendig
sein werden und welche Ersatzteile vor Ort erforderlich sind.
Bei der Auswahl einer Remote-Management-Lösung gilt es einige Kriterien zu beachten. So
ermöglicht eine Out-of-Band-Kommunikationsanbindung den Zugriff auch dann, wenn die regulären
Kommunikationsschnittstellen des Rechners oder des Netzwerks nicht mehr funktionieren. Zu prüfen
ist auch, ob die Lösung IPMI-fähig ist. IPMI (Intelligent Platform Management Interface) ist ein
allgemein akzeptierter Industriestandard, der festlegt, wie Systemmanagementdaten erfasst,
gespeichert und übertragen werden. Er bietet eine durchgehende Fernzugriffsmöglichkeit und ist
unabhängig vom Betriebssystem. Da das Ziel von Remote-Management darin besteht, einen globalen
Serverzugriff zu ermöglichen, müssen zudem die Sicherheitskonzepte durchdacht sein.
Verschlüsselung, Authentifizierung und Zugriffskontrolle sind gebräuchliche Techniken.
Als Beispiel für eine Systemmanagementlösung für Industriestandardserver, die den gesamten
Serverlebenszyklus abdeckt, lässt sich etwa die Primergy-Serverview-Suite von Fujitsu Siemens
Computers nennen. So kann der Administrator mit dem zugehörigen Tool Remotedeploy das Setup von 200
und mehr Servern beispielsweise innerhalb einer Stunde durchführen. Durch die dynamische Verteilung
von Images an einzelne Server- oder Servergruppen lassen sich auch die Rechnerressourcen
unterschiedlichen Geschäftsanforderungen entsprechend einrichten.
Das Konzept der Suite unterscheidet neben der Serverinbetriebnahme beziehungsweise Installation
zwischen "In-Band"-Management, bei dem das Betriebssystem läuft, und "Out-of-Band"-Management, bei
dem das Betriebssystem beispielsweise aufgrund defekter Hardware nicht funktioniert. Ist Letzteres
der Fall, steht das Tool Remoteview zur Verfügung. Es bietet eine Windows- oder webbasierende
Benutzerschnittstelle und arbeitet mit dem Hauptprogramm zusammen, das zur zentralen
Systemüberwachung und -kontrolle, Fehlerdiagnose und Störungsbeseitigung im "In-Band"
-Betriebszustand dient. Remoteview läuft dabei lokal auf der Controller-Hardware des verwalteten
Servers und ist somit unabhängig vom Betriebssystem. Bei einem Ausfall startet dieses Tool
automatisch und baut eine Verbindung zum zentralen Managementserver auf.