Zum Inhalt springen
Flash-Technologie und RAID

Die von der Datenflut verursachte Leistungslücke schließen

Keine Frage, RAID ist heute allgegenwärtig und stellt das Rückgrat der Speichertechnologie in modernen Datenzentren dar. Bei der Menge an Cloud-Computing, die Datenzentren basierend auf RAID-Technologie bieten, wird sich dies wohl auch auf vorhersehbare Zeit nicht ändern. Auch die Menge an Daten, die Phänomene wie soziale Plattformen im Internet, Smart-Clients, internetfähige Mobiltelefone, Big-Data oder die Ausbreitung von Videos über alle Plattformen hinweg anhäufen, tun ihr übriges. Die Kluft zwischen Datenwachstum und Investitionen in IT-Infrastruktur hat sich in den letzten Jahren jedoch erweitert. Dies führt zu Engpässen bei Datenraten für unternehmenskritische Applikationen. Flash-Speicher scheint der nächste logische evolutionäre Schritt bei RAID-Technologie zu sein.

Autor:Thomas Pavel, Director of Channel Sales bei LSI • 13.7.2012 • ca. 2:50 Min

© LSI
Inhalt
  1. Die von der Datenflut verursachte Leistungslücke schließen
  2. Datenflut verursacht Leistungslücke
  3. Leistung in Datenzentren mit Flash neu definieren

Für viele Beobachter stehen heute eher Solid-State-Drives oben auf der Liste, wenn es darum geht, die eklatante Lücke zwischen Prozessor- und Speicherleistung zu schließen. Für SSD sprechen im Vergleich zu traditionellen Festplatten vielfach schnellere Zugriffszeiten, höhere Datentransferraten, geringere Latenzzeiten und eine konstantere Leseleistung. Auf der Kostenseite jedoch ist der Austausch der gesamten Speicherarchitektur mit SSDs eigentlich unmöglich. Also würde eine ökonomisch sinnvollere Option darin bestehen, Wege zu finden um die günstige und stromsparende Flash-Technologie in die Infrastruktur von Großunternehmen zu integrieren.

Die Evolution von RAID
Bevor man sich jedoch im Detail ansieht, wie neue Flash-Technologien RAID in Zeiten unkontrollierten Datenwachstums weiterentwickeln, lohnt sich ein Blick in die Vergangenheit, wo ähnliche Probleme schon einmal die IT bremsten.

Lange bevor der erste bezahlbare Flash-Speicher auf den Markt kam, entwickelte sich RAID jahrzehntelang ungehindert. Norman Ken Ouchi bei IBM reichte im Jahre 1978 ein Patent für ein “System, um Daten in einer defekten Speichereinheit zu retten”, welches im Wesentlichen dann RAID 5 werden sollte. Erst neun Jahre später kamen drei IT-Wissenschaftler an der University of Berkeley auf die Idee, mehrere Festplatten in einer einzelnen logischen Einheit zusammenzubringen. Der veröffentlichte Artikel aus dem Jahre 1988 mit dem Titel “Argument für die Redundante Anordnung von günstigen Festplatten” brachte deutlich zum Ausdruck, dass der Grundgedanke dieser Debatte Probleme mit I/O-Leistung lösen sollte. Das gleiche Problem also, vor dem IT-Ingenieure heute stehen. Ironie, dass diese Technologie, die eigentlich für mehr Leistung sorgen sollte, im Allgemeinen eingesetzt wurde, um für eine höhere Verlässlichkeit, sprich Redundanz, von Speicher zu sorgen.

Über die Jahre hinweg entwickelten sich zahlreiche RAID-Modelle, die heute als RAID-Level bekannt sind. RAID 0 verbesserte die Leistung und fügte Speicher hinzu, tolerierte allerdings keine Fehlfunktionen, während RAID 1 es ermöglichte Daten auf zwei identische Festplatten zu schreiben und damit zu spiegeln. RAID 2 und RAID 3 synchronisierten die Rotation der Plattenspindeln und speicherte Bits und Bytes sequenziell auf einer Festplatte. Mit RAID 4 wurden Dateien dann zwischen mehreren Platten verteilt, die voneinander unabhängig arbeiteten, was I/O-Transaktionen parallel ablaufen ließ. Mit gleichen Daten, gespeichert auf einer Platte, bedeutete dies jedoch, dass die Leistung des Systems litt. RAID 5 speicherte gleiche Daten parallel. Wenn ein Fehler auftrat, konnten folgende Lesevorgänge von der verteilten Parität berechnet werden. RAID 6 bot komplette Fehlertoleranz, sogar bei Versagen von zwei Platten, was das Einsetzen größerer RAID-Gruppen für hochverfügbare Systeme praktischer machte. Seit dem Auftreten von SSDs, kommt Flash-Speicher in Tiered Storage Arrays zum Einsatz. Dies ist eine der Möglichkeiten, Flashspeicher effizient zu nutzen.

Daten über mehrere Festplatten innerhalb eines RAID-Systems zu verteilen, kann generell auf Software- oder Hardwareebene realisiert werden. Software-basiertes RAID wird gewöhnlich über das Betriebssystem gewährleistet. Betriebssysteme für Server, die logisches Volume-Management bieten, unterstützen normalerweise auch RAID und viele Betriebssysteme bieten zumindest eine grundlegende RAID-Funktionalität. Einige fortschrittliche Dateisysteme sind speziell dafür entwickelt um Daten direkt über mehrere Speicher hinweg zu organisieren. ZFS zum Beispiel unterstützt alle RAID-Level und alle Kombinationen davon. Flashspeicher kann in einem von Software-RAID verwalteten System einfach mit SSDs als hierarchische Ebene realisiert werden. Manche Dateisysteme nutzen SSDs auch als Cache, um I/Os zu beschleunigen.

Auf der Hardware-Ebene wird es in Sachen Flash-Speicher allerdings erst richtig interessant, da RAID-Controller das Betriebssystem unterstützen, indem das RAID-System als weiteres Laufwerk zusammengefasst wird. Außerdem ist auf RAID-Controllern der Read/Write-Cache angesiedelt, was sie ideal dazu geeignet macht, die Leistung des Systems zu verbessern. Denn einzelne Vorgänge sind somit nicht mehr volatil und unerledigte Schreibvorgänge sind im Fall eines Ausfalls nicht verloren, solange der Cache mit einem Backup-Mechanismus gesichert ist. Hardware-RAID bietet eine gleichbleibend hohe Leistung und fügt dem Host-Computer keinen zusätzlichen Overhead hinzu. Da RAID-Controller jedoch proprietäre Anordnungen der Daten nutzen, kann es unter Umständen unmöglich sein, Controller von verschiedenen Herstellern zu nutzen.

Anbieter zum Thema