RAID-Systeme lassen sich so oder so einsetzen - für mehr Speicher-Performance ebenso wie für gesteigerte Sicherheit. Extremeinstellungen können in der Praxis deshalb ebenso sinnvoll sein wie fein abgestufte Einsatzmodelle.
Seitdem die RAID-Technik (Redundant Array of Independent Disks) in Gestalt von Controller-Chips selbst auf den Mainboards von Massen-PCs angekommen ist, genießt sie mehr Aufmerksamkeit als zuvor - und verliert zugleich ein wenig vom Image des hochprofessionellen, verfügbarkeitsorientierten Speichermanagements, denn jetzt dient die Technik mitunter sogar Computerspielern zum schnelleren Nachladen ihrer Game-Komponenten. Dem Einsatz in künftigen Home-Multimediaservern und plattengestützten Videorecordern fiebert so mancher Hersteller schon entgegen.
Diese Situation ändert allerdings nichts daran, dass auf Sicherheit getrimmte RAID-Systeme eine perfekte Basis dafür darstellen, auch in kleineren IT-Umgebungen Daten so zu speichern, dass sie einen Plattenausfall oder andere Unbillen des Computeralltags eher ohne Dienstunterbrechung oder Verluste überstehen als auf einem Standard-Client oder Ein-Platten-Server. Sparfanatikern, die ihren Datensafe aus einem Kaufhaus-PC bauen wollen, sei dabei gleich verraten, dass die erwähnten Motherboard-Controller meist über deutlich weniger Funktionen verfügen als die Varianten auf speziellen Steckarten. Sparen kann man mit RAID allerdings nach wie vor durch den Einsatz preiswerter IDE- und SATA-Festplatten, deren mögliche Schwächen bei der Dauerhaltbarkeit ihre Schrecken verlieren, wenn die Geräte in einem Plattenverbund arbeiten.
Allen RAID-Systemen gemeinsam ist, dass sie mehrere Platten zu einem System verbinden, das aus
Sicht des angeschlossenen Computers oder des Betriebssystems wie eine einzige Harddisk
funktioniert. Neben den reinen Nutzdaten schreibt ein RAID-System zusätzliche ("redundante")
Informationen. Diese dienen dazu, bei Ausfall einer Platte die darauf gespeicherten Daten
vollständig zu rekonstruieren. Es kann aber auch eine permanente Spiegelung aller gesicherten
Informationen stattfinden, bei der die zusätzliche Platte entweder wieder der Sicherheit dient oder
beim Lesen einen beschleunigten Zugriff erlaubt.
Beim Kauf eines RAID-Systems zählen also mehrere Parameter: der Preis der verwendeten Platten,
die Geschwindigkeit des Controllers oder der Steuersoftware, die Wartungsfreundlichkeit und die
Flexibilität des Systems. Vor allem aber muss der RAID-Verbund genau den Betriebsmodus bieten, der
zum Einsatzzweck passt, wobei die Auswahl des richtigen "RAID-Levels" wieder darüber entscheidet,
wie viele Harddisks im RAID-Verbund für Nutzdaten zur Verfügung stehen.
Der Begriff "RAID-Level" legt nahe, man habe es mit Entwicklungs- oder Leistungsstufen eines
definierten funktionalen Systems zu tun. Die "Level" stehen aber für grundsätzlich verschiedene
Verfahren, die auch unterschiedlichen Zwecken dienen. RAID 0 etwa hat keinen Wert für die
Sicherheit, sondern steigert nur die Lesegeschwindigkeit bei großen Dateien, da in diesem Fall
Daten bit- oder byteweise in Streifenanordnung ("Striping") so auf mehrere Platten verteilt werden,
dass sich zusammengehörige Daten auf Anforderun über mehrere Köpfe und Platten gleichzeitig
einlesen lassen. Fällt hier nur eine Platte aus, sind die Daten bereits korrumpiert. Level 1
dagegen definiert ein auf Sicherheit getrimmtes System, das Daten auf jeweils zwei Platten zugleich
schreibt. So kann zwar insgesamt nur die halbe Kapazität genutzt werden – fällt aber eine Platte
aus, steht immer noch der "Spiegel" unversehrt zur Verfügung. Beim Lesen ist es außerdem möglich,
geschwindigkeitssteigernd auf beide Platten zugleich zuzugreifen. Beim Schreiben dagegen kommt es
zu Tempoverlusten, sofern kein mehrkanaliger Controller zur Verfügung steht. Das kaum noch
verwendete RAID 2 arbeitet ähnlich, teilt die Daten aber auf Wort- oder Bytebasis auf und verlangt
außerdem die Berechnung und zusätzliche Speicherung von ECC-Fehlercodes, was die Leistung senkt und
heute dank integrierter Hardware-Fehlerkorrektur in den Platten nicht mehr notwendig ist.
RAID 3 verwendet Paritätsinformationen: Zusätzlich zu den Datenplatten läuft im Verbund eine
weitere, auf der zu jedem Bit, das sich auf den anderen Platten an einer bestimmten Position
befindet, per XOR-Formel ein Paritätsbit errechnet und gespeichert wird. Auch in größeren Systemen
verlangt diese RAID-Variante also immer nur eine Zusatzplatte, die nicht für Nutzdaten zur
Verfügung steht. Fällt eine der synchron laufenden Platten komplett aus, ergibt sich per
Rückberechnung aus den Werten der übrigen und dem Paritätsbit eindeutig das Bit, das auf der
verlorenen Harddisk gespeichert gewesen sein muss.
Ein RAID-3-System überträgt Daten schnell, verarbeitet aber nicht mehr I/O-Anforderungen pro
Sekunde als eine Einzelplatte. RAID 4 ähnelt RAID 3, arbeitet aber mit Datenstreifen und schreibt
auch die Paritätswerte streifenweise. Hier laufen die Platten nicht zwingend synchron, aber das
System muss die Paritätsplatte bei jeder kleinen Änderung ansprechen. In der Praxis ist man deshalb
zu RAID 5 übergegangen, das die Paritätsinformationen auf alle Platten im System verteilt. Der
Betriebsengpass und "Single Point of Failure" in Gestalt der "Paritätsplatte" ist so überwunden,
nur die Rekonstruktion einer ausgefallenen Platte gestaltet sich komplizierter.
Große Bedeutung hat heute allerdings noch RAID 0+1, manchmal auch als RAID 10, RAID 1/0 oder "
Mirrored Striping Array" bezeichnet.
In diesem Fall wird das geschwindigkeitsfördernde "Striping" (RAID 0) mit dem Spiegeln (RAID 1)
verbunden, und zwar aus Sicherheitsgründen idealerweise so, dass je zwei aneinander gekoppelte
Spiegelplatten zusammen von außen streifenweise beschrieben werden. Diese RAID-Variante bietet
Sicherheit und hohe Datenverfügbarkeit zugleich, der einzige Nachteil ist der recht hohe
Plattenbedarf.
Ein RAID-System lässt sich sowohl auf der Basis spezieller Steuersoftware aufbauen als auch
mithilfe eines Controllers, der die notwendigen Funktionen mitbringt und dem Betriebssystem
vorgaukelt, der RAID-Plattenverbund sei eine einzelne Platte. Sowohl bei den Serverversionen von
Windows als auch bei Linux gehören einige RAID-Verfahren zu den Basisfunktionen. Linux etwa
beherrscht schon seit geraumer Zeit die Level 0, 1, 4 und 5. Wie der Rückgriff auf die
funktionsreduzierten Mainboard-Controller bringt ein direkt per Betriebssystemsoftware gesteuertes
RAID allerdings ein paar Nachteile mit sich: Es belastet den Prozessor des benutzten System, was
dessen Leistung begrenzt, und im Normalfall stehen nur wenige Anschlüsse für Festplatten zur
Verfügung. Sicherheitsgewinne lassen sich auf diesem Weg allerdings durchaus erzielen, und die
Implementierungskosten sind gering.
Spezielle RAID-Controller dagegen glänzen oft mit Funktionen, die den Nutzen eines RAID-Arrays
erheblich erhöhen: Mehrere Datenkanäle etwa steigern bei Speichervorgängen auf mehreren
Einzelplatten die Schreibgeschwindigkeit erheblich, und Migrationsmöglichkeiten zwischen
verschiedenen RAID-Leveln wie etwa 0 und 4, 4 und 5 oder 0 und 5 erlauben es, im Bedarfsfall von
einem sichereren Verfahren auf eines mit höherer Gesamtspeicherkapazität umzustellen, im laufenden
Betrieb die Plattenzahl zu erhöhen oder die logische maximale Kapazität der Einzelplatten im System
realer neuer Hardware anzupassen. Wer von einem schnell wachsenden Speicherbedarf in seiner
IT-Infrastruktur ausgeht, ohne jeweils neue Server anschaffen zu wollen, sollte auf derartige
Funktionen achten.
Da in RAID-Systeme oftmals bewusst kostengünstige Platten eingebaut werden, die man für ein
Einplattensystem wahrscheinlich nicht in Betracht ziehen würde, spielen die so genannten Hot-Plug-
und Hot-Fix-Fähigkeiten des verwendeten RAID-Controllers eine wichtige Rolle. Eine "Hot-Fix" oder
auch "Hot-Spare"-Platte wird im System unbenutzt auf Vorrat bereitgehalten. Der Controller
aktiviert sie beim Ausfall einer anderen Harddisk automatisch und spielt nach den bereits
beschriebenen Verfahren die Informationen des verloren gegangenen Datenträgers auf ("Auto-Rebuild"
). Ein "Hot-Plug"-Array erlaubt es, eine ausgefallene Platte bei laufendem System auszutauschen.
Auch in diesem Fall können entsprechende Controller die Daten auf der getauschten Platte per
Auto-Rebuild rekonstruieren.
Notwendige Voraussetzung für solch ein System ist Hardware, die das einfache Wechseln der
Platten ermöglicht und sich mit dem Controller über den Zustand der Platten in den einzelnen
Einsätzen verständigen kann. Trifft dies nicht zu, muss der Administrator eventuelle Rebuilds
manuell anstoßen. Speicher-Appliances, etwa als NAS-Server konfiguriert, bringen die notwendigen
Voraussetzungen mit sich und dürften für Neuanschaffungen allein schon des großen Angebots wegen
inzwischen eine echte und preiswerte Alternative zum Selbstbau darstellen.
Moderne RAID-Controller erlauben im Array die Arbeit mit Platten verschiedener Größe, wobei sie
allerdings jede Harddisk im Normalfall nur bis zur Kapazität der kleinsten Platte im System
ausnutzen.
Die Vielfalt der RAID-Verfahren mag verwirrend wirken, für die meisten Einsatzfälle aber ist die Entscheidung für das passende Modell schnell getroffen. Geht es bei RAID allein um Geschwindigkeit, ist RAID 0 perfekt, die Sicherheitslast träg dann allerdings allein das zusätzliche Backup. Die höchste Sicherheit für einen wichtigen Firmenserver bietet RAID 5, allerdings wird in diesem Fall die Anschaffung eines teuren Spezial-RAID-Controllers und mindestens drei IDE, SATA oder gar SCSI-Platten fällig. Kleinere Filialserver lassen sich gut mit vier Festplatten und einem einfachen RAID-Controller aufsetzen, der RAID 0+1 beherrscht - hier reicht vielleicht tatsächlich ein Standard-PC mit Onboard-RAID. Wer unter Linux selbst ein RAID aufsetzen will, findet im Web Anleitungen, etwa unter www.linuxhaven.de/dlhp/HOWTO/DE-Software-RAID-HOWTO.html, www.selflinux.org/selflinux/html/software_raid11.html oder www.tldp.org/HOWTO/Software-RAID-HOWTO.html.
Level 6 entspricht RAID 5 mit einer zusätzlichen Paritätsplatte. Hier dürfen sogar zwei Platten ausfallen, ohne dass Daten verloren gehen, aber die doppelte Paritätsberechnung senkt die Schreibgeschwindigkeit spürbar. RAID 7 ist eine proprietäre Lösung, die nach Level-5- oder Level-6-Art arbeitet, aber ein spezielles Betriebssystem zur Beschleunigung benutzt.