Auf dem Weg zum Storage Grid. Grid-Architekturen sind wie On Demand Buzzwords der IT-Branche. Doch was bedeutet Grid Computing bezogen auf Storage-Systeme? Und welche Hersteller haben hier die Nase vorn?
On Demand und Grid Computing ? wohl kaum ein CIO, der im vergangenen Jahr nicht mit diesen Schlagworten bombardiert worden wäre. Doch was ist Grid Computing, und abgeleitet davon, ein Storage Grid eigentlich? Ein Nestor der gesamten Grid-Technologie, der Amerikaner Ian Foster, definiert die Technologie anhand folgender Merkmale: Ein Grid muss verteilte Ressourcen in ihren verschiedenen Aspekten (Sicherheit, Ressourcenverteilung etc.) koordinieren, es muss offene, standardisierte und allgemein verwendbare Protokolle und Schnittstellen verwenden und unterschiedliche Dienstgüten je nach dem Bedarf seiner Anwender bereitstellen. Am wichtigsten ist dabei laut Foster die Verwendung von standardisierten, offenen Protokollen und Schnittstellen.
Die ersten Ansätze des Grid Computing kommen aus der Wissenschaft genau wie die meisten heute funktionierenden Grids. Basis dieser Installationen ist heute meistens das Globus Toolkit, das mittlerweile in Version 4.0 vorliegt. Die entscheidenden Forschungsanstöße hierzu gingen von der Universität von Chicago aus, die auch heute noch der Standort der Globus Alliance ist.
Standards unzureichend
Von dem amerikanischen Unternehmen Univa wird die Open-Source-Software mittlerweile kommerziell angeboten. Dessen Basis sind die Standards der OGSA (Open Grid Service Architecture). Außerdem haben sich die meisten Institutionen und Unternehmen, die am Grid Computing interessiert sind, im Global Grid Forum (www.ggf.org) zusammengefunden.
Weil Grid Computing aus der Forschungssphäre kommt, hat man bestimmten geschäftskritischen Themen bisher zu wenig Priorität eingeräumt. Transaktionssicherheit ist eines von ihnen. Dieser Themen nimmt sich nun die Enterprise Grid Alliance (EGA, www.gridalliance.org) an.
So weit, so gut. Doch was bedeutet das alles nun für Storage? Storage-Systeme sind, da sie nun einmal die Daten der Anwendungen halten, im Grunde für jedes Grid-System unverzichtbar. Allerdings verschwinden sie, so lange sie als Direct Attached Storage (DAS) direkt am Server hängen, hinter diesem. Interessant werden Storage Grids erst mit vernetzten Storage-Technologien wie NAS und SAN, die es erlauben, Speichereinheiten unabhängig von einem Server zu installieren. Im Globus Toolkit sind beispielsweise Komponenten enthalten, die im Grid vorhandene Storage-Ressourcen entdecken und ihre Eigenschaften recherchieren können.
Tony Asaro, Senior Analyst beim Marktforschungsutnernehmen Enterprise Strategy Group, definiert im E-Mail-Interview mit InformationWeek ein Storage Grid als ein »hochskalierbares Multiprotokoll- und Multiservice-Speichersystem (SAN, NAS, CAS, VTL), das intelligente Datenmanagement- und Datenschutzfähigkeiten integriert und dem Anwender als eine logische Einheit erscheint.« Asaro fügt allerdings auch gleich hinzu, dass es noch »unzählige Herausforderungen« gebe, bis dieses Ziel erreicht sei. Dazu gehören die Cache-Kohärenz zwischen den Controllern der beteiligten Systeme, die Vielzahl der Protokolle, die an einem Storage-Grid beteiligt sind und koordiniert kommunizieren müssen sowie hohe Aufwendungen für die Zertifizierung und das Testen von Grid-Systemen.
Sieht man sich auf dem Markt um, haben heute vor allem Netapp, HP und IBM brauchbare Ansätze im Storage-Grid aufzuweisen. Andere, wie EMC, wollen von möglicherweise räumlich verteiltem, aber dennoch als logischer Einheit fungierendem Speicher nichts wissen. »Es gibt kein Storage Grid«, sagt Mika Kotro, zuständig für das Produktmarketing bei EMC, kurz und bündig. Selbst Oracles für Grid Computing gemäß den OGSA-Standards vorbereitete Datenbank 10g speichere schließlich die Daten zentral. »Nur so lassen sich die Daten optimal schützen«, sagt er. »Ein Standort und ein Spiegelstandort sind genug.«