Die jeweiligen Stärken von HDD, SSD und DRAM nutzen

Hybride Storage-Pools

12. Dezember 2013, 10:17 Uhr | Heiko Wüst, Sales Engineer bei Nexenta Systems
Hybrid-Storage
© Seagate

Wie balanciert man Kosten und Leistung beim Speicher mit verschiedenen Speichermedien optimal aus? Das wichtigste dabei ist die Konzentration auf das "Working Size Set", also die Daten, die tatsächlich genutzt werden.

In den letzten Jahren kristallisierte sich ein Problem moderner Speichersysteme mehr und mehr heraus: Normale Systeme konnten mit dem ungeheuren Bedarf moderner Applikationen nach immer mehr Leistung nicht Schritt halten. Die Leistungsschübe auf der Prozessorseite waren enorm, die Speicherseite ihrerseits stagnierte. Um diese Lücke zu schließen, mussten teure HDDs angeschafft werden, um einen moderaten Schub an Leistung in Form von kürzerer Latenzzeit zu erreichen oder es musste mehr Kapazität eingekauft werden als eigentlich nötig war, um die Leistung zu erhöhen.

Eine Möglichkeit, dieses Problem zu lösen, besteht grundsätzlich darin, Flash-Speicher zu nutzen. Jedoch sprechen die hohen Kosten in der Praxis oft dagegen. Nun, da die Preise für Flash langsam fallen, integrieren immer mehr Hersteller von Speicherhardware Flash in ihre Produkte. Ein architektonisch viel sinnvollerer Ansatz, Flash zu nutzen, liegt jedoch im Dateisystem. Dieses sollte verschiedene Speichermedien automatisch, effizient und intelligent nutzen – nicht zuletzt, um die hohen Investitionen in Flash-Speicher zu rechtfertigen.

Hybrid-Storage-Pools holen das Beste aus den Speicherressourcen heraus

Eine Technologie, die es schafft, Flash effizient zu nutzen ist der Hybrid-Storage-Pool (HSP) im Open-Source-Dateisystem ZFS. Dieser Pool integriert DRAM, SSDs und rotierende HDDs zu einem einzigen virtuellen beschleunigten Speichermedium. Der Hybrid-Storage-Pool ist ein Standard in ZFS-basierten Produkten, das man in vielen anderen Dateisystemen vergeblich sucht. Um maximale Effizienz und Performance zu erreichen, werden die Daten in einem Hybrid-Storage-Pool hierarchisch über drei unterschiedliche Pfeiler verteilt (siehe Diagramm 1).

 

Anbieter zum Thema

zu Matchmaker+
Diagramm 1: Daten in einem Hybrid-Storage-Pool werden über den Adaptive-Replacement-Cache hierarchisch verteilt.
Diagramm 1: Daten in einem Hybrid-Storage-Pool werden über den Adaptive-Replacement-Cache hierarchisch verteilt.
© Nexenta

DRAM ist die erste Wahl

Die „beste Adresse“ für alle geschriebenen Daten in einem solchen Pool ist der schnelle Adaptive-Replacement-Cache (ARC), der sich im DRAM befindet. Dies ist die Quelle für das Lesen von Daten mit der geringsten Latenz. ZFS prüft bei einer Anfrage nach Daten zuerst, ob sich diese im ARC befinden. Sind diese dort, können sie innerhalb von Nanosekunden gelesen werden und erreichen somit sehr schnell die Anwendung, die die Daten benötigt. Welche Daten innerhalb des ARC vorgehalten werden, entscheidet ZFS automatisch nach den Kriterien "Most Recently Used" (MRU) und "Most Frequently Used" (MFU).

SSD ist zweite Anlaufstation

Der zweite Pfeiler ist das "Level 2 ARC" (L2ARC), das aus SSDs besteht. Ohne L2ARC müssten alle Daten, die im ARC keinen Platz finden, von langsamen Festplatten gelesen werden. SSDs überbrücken den Geschwindigkeitsunterschied zwischen DRAM und HDDs, der mehrere Millisekunden beträgt. SSDs sind teurer als HDDs; es ist aber deutlich günstiger, hunderte Gigabyte-Flashspeicher in Form von SSDs anzuschaffen, als die gleiche Menge in DRAM. Die I/Os auf SSDs sind zwar langsamer als bei DRAM, der Durchsatz ist jedoch bekanntermaßen deutlich höher als bei Festplatten. Der dritte Pfeiler des Hybrid-Storage-Pools sind schließlich HDDs. Welche Daten auf der zweiten Cache-Ebene gespeichert werden, entscheiden wiederum intelligente Algorithmen innerhalb von ZFS. Auf den HDDs schließlich befinden sich alle Daten, auch die gecachten. Dies ist ein entscheidender Unterschied zu Tiered-Storage, wo die Originaldaten zwischen schnelleren und langsameren Daten verschoben werden müssen.


  1. Hybride Storage-Pools
  2. Entscheidend ist die Working-Size

Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Server, Datacenter

Matchmaker+