Der Ansatz ist dabei ebenso einfach wie einleuchtend. Avance besteht aus zwei Xen-Servern, einem Master- und einem Standby-Node. Auf den Xen-Hosts arbeiten die quasi ausfallsicheren virtuellen Rechner. Dank Xen-Motion lassen sich VMs zur Laufzeit vom Master- auf den Standy-Node umziehen. Fällt der Master-Node jedoch ohne Vorwarnung aus, starten die VMs nach einer geringen Ausfallzeit auf dem Backup-System neu.
Diese Funktionen lassen sich so weit alleine mit Xen-Features abbilden. Das wesentliche Stratus-Know-how, was die Lösung vom nackten Xen-Cluster abhebt, ist das Hardware-Monitoring. Stratus geht davon aus, dass sich die meisten Ausfälle von Serverkomponenten vorhersagen lassen. Alle neuen Server-Boards verfügen über eine IPMI-Schnittstelle (Intelligent-Platform-Management-Interface).
Darüber kann Avance den Zustand der Hardware ermitteln. Zu den ausgewerteten Informationen zählen dabei die Spannungen des Netzteils, Temperaturen von System und CPU sowie Fehlerinformationen des ECC-Speichers. Die korrekte Funktion der Platten kann die Software über das S.m.a.r.t.-Interface (Self-Monitoring, Analysis and Reporting Technology) erfragen.
Stratus-Avance überwacht diese Messwerte permanent. Sollte der primäre Server auch nur die geringsten Probleme melden, lässt die Software die VMs auf den Backup-Knoten umlagern.
So versucht die Lösung, einem drohenden Ausfall rechtzeitig vorzugreifen. Im Labor Poing installiert Stratus für den Test einen Cluster aus zwei Dell-Poweredge-1950-Servern. Die Quad-Core-Maschinen mit je 4 GByte RAM verfügen über zwei 72-GByte-SASPlatten. Über ein privates Netzwerk mit den jeweiligen Eth1-Ports kommunizieren die Cluster-Nodes untereinander. Nur das erste Interface steht für Management und virtuelle Maschinen (VMs) zur Verfügung.