Der "Red Hat Storage Server" (RHSS) schließt physische oder virtuelle Red-Hat-Linux-Server zu einem gut skalierbaren Scale-out-Storage-Cluster zusammen. Die Lösung ist sowohl für den Einsatz in Unternehmen als auch für die Integration mit Cloud-Anbietern erhältlich. Zum LANline-Test trat die seit Oktober 2014 verfügbare Version RHSS 3.0 an.
Mit dem RHSS bietet Red Hat im Markt für Software-Defined Storage (SDS) ein Scale-out-Speichersystem an. Die im Oktober 2014 vorgestellte Version 3.0, die auf Red Hat Enterprise Linux (RHEL) 6.6 basiert, unterstützt pro Storage-Cluster bis zu 128 Knoten. In der für 2015 erwarteten nächsten Version will Red Hat die Skalierbarkeit auf mehrere Tausend Nodes pro Cluster ausbauen.
Für Unternehmen bietet RHSS eine gut skalierbare Lösung, die für unstrukturierte Daten große Speicherkapazitäten über NAS-Standardprotokolle wie NFS und CIFS/SMB vergleichsweise günstig bereitstellen kann. Ein großes Wachstumspotenzial für den Storage-Server sieht Red Hat zudem bei Big-Data-Anwendungen wie Hadoop sowie bei umfassenden Security-Analysen, wie sie beispielsweise der Hersteller Splunk anbietet. RHSS 3.0 bringt bereits ein Hadoop-Plug-in mit, eine Integration mit Splunk wird demnächst folgen. Der Markt für High-Performance- und Low-Latency-Speichersysteme steht bei der Entwicklung von RHSS dagegen bislang nicht im Fokus.
Red Hat bietet RHSS auch als Public-Cloud-Variante an, die sich mit Amazon Web Services (AWS) integriert. RHSS ist dafür als Amazon Web Image (AMI) implementiert, womit sich in der Cloud skalierbare virtualisierte NAS-Speicher-Cluster bereitstellen lassen, die als zentraler Storage Pool verwaltet werden. Für den LANline-Test wählten wir die für den Einsatz in Unternehmen vorgesehene RHSS-Version, die ebenfalls Schnittstellen für die Cloud-Integration enthält. So lassen sich zum Beispiel mithilfe eines REST APIs (Representational State Transfer, Application Programming Interface) Provisioning-Vorgänge automatisieren. RHSS unterstützt zudem Openstack Swift, ein Object-Storage-Service, der bei Red Hat auf NFS aufsetzt. Damit können Unternehmen File-basierende Anwendungen in sanfter Weise auf Object Storage migrieren.
Installation von RHSS 3.0
Die Installation von RHSS ist auf mehreren Wegen möglich. Der Storage-Server lässt sich mithilfe einer ISO-Datei von DVD oder per PXE-Boot über das Netzwerk installieren. Auch ein Setup über Red Hat Satellite Server wird unterstützt. Voraussetzung ist eine Subscription mit den erforderlichen Lizenzschlüsseln. RHSS lässt sich zudem als virtueller Server auf der KVM-Plattform (Kernel Virtual Machine) Red Hat Enterpise Virtualiziation oder auf "VMware Vsphere ESXi"-Hosts betreiben. In dieser Konfiguration verwaltet RHSS die Speicherkapazitäten der Virtualisierungsplattform als sogenannten "Single Namespace".
Für den LANline-Test kamen zwei physische Dell-T620-Server mit Intel-CPU zum Einsatz. RHSS läuft auch auf Servern mit AMD-Prozessoren. Die Installation erfolgte mithilfe einer Boot-DVD. Im textbasierenden Setup-Wizard gibt der Administrator unter anderem den Hostname und die IP-Adresse ein. Bei den zu verwaltenden Storage-Geräten stehen die Optionen "Basic" und "Specialized" zur Wahl. Mit Basic bindet RHSS alle lokal angeschlossenen Speicherlaufwerke in den zentralen Storage Pool ein. Die Specialized-Option ermöglicht es, iSCSI- oder FCoE-Speicher von SAN-Speichersystemen in den RHSS-Storage-Pool zu integrieren.
Im Partitionierungsdialog legt der Administrator fest, ob RHSS alle vorhandenen Speicherkapazitäten verwenden soll, oder ob einzelne Partitionen nicht zu formatieren sind. Die Grundinstallation von RHSS 3.0 war im Test nach wenigen Minuten abgeschlossen. Anschließend registrierten wir die zwei Server bei Red Hat und luden die Softwareaktualisierungen über das Red Hat Network herunter. Die dafür erforderlichen Befehlszeilen sind in der ausführlichen RHSS-Dokumentation gut beschrieben.
Management per GUI oder CLI
Um RHSS-Cluster mit einer größeren Zahl an Knoten zentral verwalten zu können, hat Red Hat eine grafische Konsole entwickelt. Der Zugriff auf die Red Hat Storage Console (RHSC) erfolgt per Web-Browser. Unter Linux ist Firefox 24 oder höher erforderlich, unter Windows Internet Explorer 9 oder 10. RHSC läuft auf RHEL-Servern ab Version 6.4. Wir richteten für den LANline-Test auf einer VMware Workstation ein virtuelles RHEL-6.5-System ein und installierten darauf die Storage Console. Die dafür erforderlichen Schritte sind im RHSC Installation Guide detailliert beschrieben. Als Datenbank verwendeten wir die integrierte Postgres-Version. Alternativ lässt sich RHSC auch mit einer externen Datenbank verbinden. Die Storage Console bringt als "Technology Preview" auch eine Kommandozeile (CLI) inklusive Scripting-System mit, über das sich Speicher-Management-Funktionen automatisieren lassen.
Nachdem wir RHSC installiert hatten, aktivierten wir die von Red Hat für den Test bereitgestellten Subscriptions und spielten die verfügbaren Updates ein. Anschließend führten wir das Skript "rhsc-setup" aus, das Schritt für Schritt durch die Grundkonfiguration leitet. Als diese Arbeiten beendet waren, konnten wir von einem Windows-Rechner aus per Internet Explorer auf die grafische Verwaltungsoberfläche (GUI) zugreifen.
Als Erstes erstellten wir dort einen neuen Cluster und fügten ihm die beiden Storage-Server hinzu. Dafür sind nur wenige Angaben erforderlich. Die Storage Console führt anschließend die für die Clusterkonfiguration benötigten Kommandozeilenbefehle im Hintergrund aus. RHSS basiert auf "Glusterfs", das die Open Source Community entwickelt. Die Cluster-Nodes sollten über ein 10-Gigabit-Ethernet-Netzwerk miteinander verbunden sein, um eine hohe Performance sicherzustellen.
Die Red Hat Storage Console bietet eine einfach gehaltene grafische Oberfläche, die den aktuellen Zustand aller Cluster und der zugehörigen Knoten übersichtlich darstellt. Die wichtigsten RHSS-Konfigurationen lassen sich über das GUI komfortabel erledigen. Für den Schutz vor Datenverlusten beim Ausfall einer physischen Festplatte empfiehlt Red Hat, die lokal im Server verbauten Platten als RAID 6 zu konfigurieren. Die zweite Grundeinheit von RHSS bilden die sogenannten Bricks. Sie werden auf der Basis des physischen RAID-Verbunds auf jedem Cluster-Node als logische Volumes konfiguriert und als Verzeichnis exportiert.
Bricks und Logical Volumes
RHSS virtualisiert diese logischen Einheiten, indem es aus mehreren Bricks virtuelle Volumes erzeugt, die Teil des gemeinsamen Cluster-Storage-Pools sind. Als File-System kommt XFS zum Einsatz, das den Zugriff auf die Daten unter anderem per NFS und CIFS/SMB ermöglicht. Mithilfe dieser Konstruktion ist es möglich, virtuelle Volumes im laufenden Betrieb zu vergrößern oder zu verkleinern, indem sich Bricks hingefügen oder entfernen lassen.
Der Standard-Volume-Typ von RHSS ist "Distributed Replicated" und mit einer RAID-10-Konfiguration vergleichbar, bei der die Daten gespiegelt und "gestripet" werden. Die Replikation auf mindestens ein Partner-Volume bietet einen zusätzlichen Schutz vor Datenverlusten. RHSS unterstützt des Weiteren die Volume-Typen "Distributed", "Replicated", "Striped", "Striped Replicated", "Distributed Striped" und "Distributed Striped Replicated". Im Gegensatz zu vielen anderen SDS-Lösungen benötigt RHSS keinen dedizierten Metadaten-Server, sondern lokalisiert die Dateien mithilfe eines speziellen Hash-Algorithmus. Dies bietet laut Red Hat eine bessere Performance und Skalierbarkeit.
Konfiguration logischer Volumes
Für den LANline-Test richteten wir auf beiden RHSS-Servern die zusätzlich zur System-Disk vorhandenen vier physischen 15k-SAS-Platten als RAID 5 ein. Dann erstellten wir auf jedem Storage-Server drei logische Volumes mit je 100 GByte Speicherkapazität und exportierten sie als Bricks-Verzeichnis. Im nächsten Schritt legten wir ein neues Distributed Volume an, das von jedem Server ein logisches Bricks-Volume verwendete. Zudem richteten wir ein Distributed Replicated Volume ein, das pro Cluster-Node mindestens zwei Bricks-Volumes benötigt. Im Assistenten für die Erstellung von Volumes behielten wir die Standardeinstellungen bei, die den Zugriff auf ein neues Volume sowohl über NFS als auch über CIFS/SMB automatisch konfigurieren. Über den Menüpunkt "Allow Access From" kann der Administrator den Zugriff auf ein Volume einschränken auf die gewünschten Hostnames beziehungsweise IP-Adressen.
Die beiden NAS-Shares konnten wir anschließend auf den Rechnern unseres Testnetzes als Netzlaufwerk anbinden und sie als Datenlaufwerke nutzen. Greift der Anwender von Linux-Rechnern aus auf RHSS-Daten zu, bietet der "Fuse Native Client" von Red Hat die beste Performance.
Speicher-Management im Aufbau
Bei den Speicher-Management-Funktionen kann RHSS 3.0 bislang mit traditionellen Storage-Systemen noch nicht ganz mithalten. So lässt sich ein Storage-Tiering nur statisch auf der Ebene der physischen RAID-Arrays einrichten. Eine dynamische Verschiebung von Daten zwischen schnelleren SSDs und langsameren HDDs ist für das nächste Release geplant. Bereits in RHEL implementiert aber noch nicht dokumentiert ist eine neue Cache-Technik, die SSDs transparent als File Cache verwenden kann.
Die Snapshot-Funktionen haben derzeit noch den Status "Technology Preview". Das nächste RHSS-Release soll auch dort erweiterte Funktionen bieten. Zudem arbeitet der Hersteller bereits an einer File-System-Komprimierung. Eine Deduplizierung findet sich bislang nicht auf der Roadmap. Bereits vorhanden sind Disk Quotas zur Begrenzung des nutzbaren Speicherplatzes sowie eine enge Integration mit Nagios, die ein umfassendes Monitoring von RHSS-Clustern inklusive automatisierter Alarmierungen ermöglicht. Für die Performance-Überwachung und -Analyse bringt RHSS die Tools "Top" und "Profile" mit. Der Storage-Server unterstützt auch verschlüsselte Datenlaufwerke.
Eine Integration mit Verzeichnisdiensten wie Microsoft Active Directory oder Red Hat Directory Server ist über das "Domain Management"-Tool von RHSS möglich. Der Administrator kann auch mehrere Domänen mit der Management-Konsole verbinden. Die aktuelle Systemkonfiguration lässt sich mit dem "Backup"-Tool von RHSS sichern.
Auf der Roadmap für 2015 spielt das sogenannte "Erasure Coding" eine wichtige Rolle. Damit lassen sich Daten ohne die bisher dafür erforderliche Replikation redundant speichern. Die neue Redundanztechnik soll auch Bricks ohne darunterliegende physische RAID-Konfiguration vor Datenverlusten schützen.
Fazit
Mit dem Red Hat Storage Server können Unternehmen auf der Basis von Standard-Intel- oder AMD-Servern hochverfügbare Scale-out-NAS-Cluster aufbauen. Das von Glusterfs bereitgestellte XFS-File-System kann virtuelle Volumes als NFS- oder CIFS/SMB-Share bereitstellen, sodass an den Anwendungen keine Änderungen erforderlich sind.
RHSS ist auch als vorkonfigurierte Cloud-Version für Amazon Web Services erhältlich. Über ein REST API sowie Openstack Swift lässt sich der Storage-Server auch in andere Cloud-Plattformen integrieren. Bei den Speicher-Management-Funktionen besteht noch Aufholbedarf, bis RHSS traditionellen Storage-Arrays in allen Bereichen Paroli bieten kann.
Der Listenpreis von 8.000 Euro für zwei Cluster-Nodes inklusive ein Jahr Subscription und Support ist für kleinere Unternehmen mit überschaubaren Kapazitätsanforderungen sicher kein Schnäppchen. In dem Preis sind jedoch alle Speicher-Management- und Hochverfügbarkeitsfunktionen sowie unlimitierte Speicherkapazitäten enthalten. Bei einem Einsatz von Servern mit hohen lokalen Speicherkapazitäten von beispielsweise 100 TByte wird RHSS auch preislich durchaus interessant.
Der Autor auf LANline.de: chjlange
Info: Red HatTel.: 089/2050710Web: www.redhat.com/de