Bundesamt für Sicherheit in der Informationstechnik

M 2.362 Auswahl einer geeigneten Speicherlösung

Verantwortlich für Initiierung: Behörden-/Unternehmensleitung, IT-Sicherheitsbeauftragter

Verantwortlich für Umsetzung: IT-Sicherheitsbeauftragter, Leiter IT

Um fundiert zu entscheiden, welche Speicherlösung im jeweiligen Anwendungsfall angemessen ist, sind die technischen Grundlagen unterschiedlicher Techniken detailliert zu beleuchten und deren Auswirkungen auf den möglichen Einsatz in der Institution zu prüfen. Die Entscheidungsgrundlagen müssen dabei nachvollziehbar dokumentiert werden.

Network Attached Storage

NAS -Systeme sind spezielle Speichersysteme, die dem Client Speicherplatz als nutzbares Dateisystem zur Verfügung stellen. Als Dateisystem werden hierfür meistens Windows ( SMB /CIFS) oder Unix ( NFS ) zur Auswahl gestellt. NAS -Systeme sind sehr einfach in eine bestehende Netzinfrastruktur zu integrieren. Sie können wie Server an das Netz der Institution angeschlossen werden. Entsprechend sind NAS -Systeme oft als "Appliance" ausgeführt. Sie werden betriebsfertig ausgeliefert und können nach einigen elementaren Konfigurationen ( z. B. der Netzeinstellungen) in Betrieb genommen werden. Basissoftware eines NAS -Systems ist üblicherweise eine für diesen Einsatzfall minimierte und optimierte Version eines Standard-Betriebssystems (häufig Unix oder Linux, gegebenenfalls auch Windows).

Die einfache Anbindung erweist sich gleichzeitig als ein Nachteil von NAS , da die NAS -Systeme über Ethernet-Technik mit den Servern beziehungsweise Clients verbunden sind. Die darunter liegenden TCP / IP -Protokolle haben einen relativ geringen Durchsatz und verwenden dabei einen relativ großen Protokoll-Overhead. So sind sie im Grunde nicht für den schnellen Zugriff auf Massenspeicher ausgelegt. Werden NAS -Systeme eingesetzt, kann daraus eine hohe Belastung des LAN s folgen. In vielen Anwendungsfällen ist jedoch festzustellen, dass eine Gigabit-Ethernet-Anbindung im Realbetrieb hinreichend schnell ist und durch eine geeignete Architektur des LAN s Engpässe de facto nicht zu beobachten sind.

Durch die Verwendung von Standardnetzen und Standardprotokollen besitzen NAS-Systeme die gleichen Schwachstellen, die auch Unix- oder Windows-Server betreffen.

Weniger geeignet sind Standard- NAS -Systeme als Speicherlösung für Anwendungen, die nicht dateiorientiert arbeiten. Darunter fallen alle größeren Datenbanken und zum Beispiel auch Microsoft Exchange-Server. Wenn eine solche Anwendung auf einem NAS -System betrieben werden soll, ist zu überprüfen, ob Produkte am Markt verfügbar sind, die spezifisch für den Betrieb des Produktes und das Einsatzszenario optimiert sind.

Ein NAS -System kann oft für eine Reihe von Servern zum Einsatz kommen. Obwohl die reinen Hardwarekosten meistens deutlich höher sind als der Ausbau der einzelnen Server mit mehr und/oder größeren Festplatten, kann dadurch die Verfügbarkeit erheblich verbessert werden. Deutliche Vorteile liegen in der oft vorhandenen Möglichkeit, durch Konfiguration des Geräts oder Hardwareerweiterungen im laufenden Betrieb Kapazitätsanforderungen ohne Stillstand zu erfüllen. Verbesserungen sind auch bei der Datensicherung zu erzielen. Mit direkt angeschlossenen Datensicherungsgeräten (Bandlaufwerken, Optical Discs, Jukeboxen zur Archivierung) ausgestattet, kann eine Vereinfachung, Beschleunigung und Stabilisierung bei der Sicherung von Datenbeständen, die über gewachsene Serverlandschaften verteilt sind, erzielt werden.

Ein Nachteil von einfachen NAS -Systemen ist, dass ein Ausfall oft weiter reichende Folgen hat als der Ausfall eines einzelnen Servers und dass ein Ausfall nicht einfach durch ein in der Institution kurzfristig verfügbares Ersatzsystem kompensiert werden kann.

Storage Area Networks

SAN s bestehen aus Plattensubsystemen, Datensicherungssystemen und einer eigenen Netzinfrastruktur. Plattensubsysteme fassen intern eine Menge von Festplatten zusammen. Hier wird unterschieden, ob diese Zusammenfassung lediglich durch ein gemeinsames Gehäuse und eine gemeinsame Stromversorgung geschieht (JBOD = Just a Bunch of Disks) oder ob ein spezielles Schaltgerät, der sogenannte RAID-Controller mithilfe der RAID-Technik (RAID = Redundant Array of Independent Discs) die physischen Festplatten zu virtuellen Festplatten zusammenfasst. Darüber hinaus gibt es intelligente RAID-Controller, die weitere Dienste zur Verfügung stellen können.

Durch die Zusammenfassung mehrerer physischer Festplatten zu virtuellen Einheiten (Pools), auch "Speichervirtualisierung durch Pooling" genannt, kann durch geschicktes Kombinieren von physischen Festplatten die Ausfallsicherheit oder die Performance des Gesamtsystems oder beides erhöht werden. Der Speicher-Controller zeigt nach außen nur die zusammengefassten Festplatten (virtuelle Festplatte oder logisches "Volume") und verteilt die Daten, die er auf einer solchen Festplatte schreiben soll, auf die einzelnen physischen Festplatten.

Diese Funktionalität kann auch im Server mithilfe einer speziellen Applikation, dem "Volume Manager", umgesetzt werden, wobei dann der Server stärker belastet wird.

Es existieren verschiedene Algorithmen, nach denen die Datenverteilung geregelt wird, die sogenannten RAID-Level. Wenn das RAID-Level die Speicherung von redundanten Informationen unterstützt, bleiben die gespeicherten Informationen selbst nach dem Ausfall einer Festplatte intakt und können rekonstruiert werden. Oft können einzelne Festplatten des Plattensubsystems im laufenden Betrieb ausgetauscht werden ("hot swap").

Plattensubsysteme bieten die Möglichkeit, alle Teilkomponenten redundant auszulegen und können somit zur Erhöhung der Verfügbarkeit eingesetzt werden. Ein weiterer Vorteil ist, dass durch passende Konfigurationsmechanismen der einer Anwendung zugeordnete Speicherplatz an ihren Platzbedarf angepasst werden kann.

Ein Plattensubsystem stellt lediglich Speicher für die Anwendungen zur Verfügung. Selbst bei redundanter Speicherung der Daten ist eine zusätzliche Datensicherung notwendig, da z. B. logische Fehler beim Datenbestand durch Hardwareredundanz im Speichersystem nicht korrigiert werden können. Als Systeme zur Datensicherung sind Bandlaufwerke, optische Medien, aber auch wiederum spezielle Festplattensysteme nutzbar. Auch diese Geräte werden direkt in das Speichernetz integriert.

SAN s verwenden eine eigene Netzhardware und eigene, für den Anwendungsfall geeignete schnelle Netzprotokolle. Meistens sind Glasfaserkabel im Einsatz (Systembezeichnung: Fibre Channel, kurz FC). Ein einfaches Storage Area Network besteht aus einem Fibre-Channel-Switch oder -Director (größere Switches, die mit mehr Funktionalität ausgestattet sind, werden oft als Director bezeichnet), einem oder mehreren Plattensubsystemen und den Servern, die über sogenannte Host Bus Adapter, kurz HBA, mit dem Fibre-Channel-Switch verbunden werden.

Fibre-Channel-Netze verwenden ein spezielles, an die Anforderung von Massenspeichernutzung angepasstes Protokoll, das hohe Übertragungsraten ermöglicht und deshalb für Speichersysteme sehr geeignet ist. Ebenfalls möglich ist der Einsatz von iSCSI -Geräten. iSCSI nutzt hierbei das IP -Netz und "verpackt" Speicherprotokolle, also Steuerbefehle für Massenspeicher und zugehörige Daten, in IP -Pakete. iSCSI wird eingesetzt, um über eine virtuelle Ende-zu-Ende-Verbindung den Zugriff von Servern mittels iSCSI Host Bus Adapter auf das Speichernetz zu ermöglichen, ohne dass eigene Speichernetze betrieben werden müssen. Vorhandene Netzkomponenten ( LAN -Switches) können genutzt werden, es muss keine neue oder von der vorhandenen Netztechnik verschiedene Hardware für die Verbindungen zwischen Servern und Speichergeräten eingesetzt werden. Der Begriff SAN wird im Folgenden für beide Techniken verwendet. Wenn eine Unterscheidung notwendig sein sollte, wird "Fibre Channel SAN " oder FC- SAN und entsprechend iSCSI -SAN oder IP - SAN verwendet.

Ein großer Vorteil von SAN s ist ihre Desaster-Toleranz. Das Konzept des Multi-Pathings, das im SAN konsequent verfolgt wird, spielt dabei eine wesentliche Rolle: Falls es einem Server möglich ist, ein Plattensubsystem über mehrere Host Bus Adapter und über unterschiedliche Netzverbindungen zu erreichen, so kann der Datentransfer zwischen beiden Systemen auf mehrere Datenwege verteilt werden. Durch den Einsatz mehrerer Host Bus Adapter in den Servern und die Präsentation der virtuellen Festplatten auf mehreren Schnittstellen eines Plattensubsystems lassen sich somit die mögliche Übertragungsgeschwindigkeit und Verfügbarkeit des Speichersystems effektiv steigern. Wenn zwei oder mehr Host Bus Adapter in einem Server genutzt werden, so wird bei Ausfall eines Adapters die Last auf den oder die verbleibenden HBAs verlagert. Dieses für Betriebssystem und Anwendungen transparente "Failover" verbessert somit die Verfügbarkeit des Servers. Entsprechend kann durch eine redundante Auslegung aller Teilkomponenten eines SAN s eine sehr hohe Ausfallsicherheit erreicht werden. Die Maßnahme M 2.354 Einsatz einer hochverfügbaren SAN-Lösung beschreibt dieses Thema ausführlicher.

So wäre es in einem kleinen Storage Area Network denkbar, dass sich an zwei möglichst weit auseinander liegenden Orten auf dem Betriebsgelände jeweils ein baugleiches Speichersystem befindet. Jedes dieser Speichersysteme ist mit einem von zwei wiederum getrennt installierten Switchen verbunden. Um eine redundante Verbindung zum SAN zu gewährleisten, verfügen die Server zumindest über zwei Host Bus Adapter, sodass jeder Host Bus Adapter mit einem der beiden SAN -Switches verbunden ist. Somit wäre ein Ausfall einzelner Leitungen, eines HBAs, eines Switches oder sogar eines Speichersystems ohne Beeinträchtigung der Gesamtsystemleistung denkbar.

Beim Design eines SAN s ist es leicht möglich, Redundanzen zu schaffen, sodass ein Ausfall einzelner Komponenten wie Kommunikationsleitungen, Switchen oder sogar eines Plattensubsystems, keine Beeinträchtigung der Gesamtsystemleistung bewirkt.

Bei höchsten Anforderungen an die Verfügbarkeit kann dieser Ausbau so erweitert werden, dass in zwei oder mehr räumlich weit auseinander liegenden (bis zu 100 km) und technisch autarken Rechenzentren jeweils in allen Komponenten redundante SAN s aufgebaut werden. So kann im Extremfall der Ausfall eines kompletten Rechenzentrums ohne Betriebsunterbrechung oder Kapazitätsverlust für die Anwender kompensiert werden.

Weitere Redundanz lässt sich durch "Cluster"-Server erreichen, die eine logische Maschine auf zwei oder mehr physische Server verteilen. Dabei wird eine Anwendung auf zwei oder mehr Servern installiert. Diese Server arbeiten mit denselben Anwendungsdaten. Falls ein Server eine Störung erleidet, übernimmt der zweite Server automatisch die Arbeit der ausgefallenen Hardware.

Erkauft werden die positiven Eigenschaften einer SAN-Lösung durch Preis und Komplexität. Die selbe Menge Speicher ist in der Realisierung durch ein SAN um ein Vielfaches teurer als in der Ausführung als Direct Attached Storage oder NAS .

Zudem ist auch die Planung und der Aufbau eines SAN s sehr komplex, sodass die Institution speziell geschultes Personal einstellen muss oder externe Unterstützung benötigt.

Zusammenfassung

Kurz dargestellt ist NAS eine Speicherlösung mit dateibasiertem Zugriff, SAN eine Speicherlösung mit blockbasiertem Zugriff. SAN setzt also "tiefer" an und bietet alle technischen Möglichkeiten, die für die Datenspeicherung angeboten werden. NAS ist als Erweiterung der Serverlandschaft einer Institution anzusehen.

Hybrid-Storage

Eine Speicherlösung, die eine Kombination zwischen NAS und SAN darstellt, wird oftmals unter der Bezeichnung Hybrid-Storage oder kombinierte Speicherlösung (Unified Storage) geführt.

Der interne Aufbau solcher Systeme erfüllt alle Kriterien eines SAN s. Nach außen können sie jedoch sowohl als NAS als auch als SAN betrieben werden. Dieser Mischbetrieb wird durch den Einsatz entsprechender Systemkomponenten und eine entsprechende Konfiguration ermöglicht. So kann sich ein Speichersystem sowohl für einige Anwendungen per Ethernet-Anschluss als "Filer" präsentieren und somit Fileservices über CIFS und NFS zur Verfügung stellen als auch für andere Server per Fibre Channel oder iSCSI Speicherkapazität zugänglich machen.

In der Praxis können NAS - und Storage-Controller entweder in einem IT-System zusammengefasst werden oder als physisch getrennte Komponenten vorliegen. Neben klassischen Fibre-Channel- SAN -Switchen können auch sogenannte Converged oder Unified Switches zum Einsatz kommen, die neben FC auch Fibre Channel over Ethernet (FCoE) und IP bedienen.

Objekt-Storage

Objekt-Storage (oftmals auch als "Object-based Storage" bezeichnet) ermöglicht gegenüber den traditionellen blockbasierten und filebasierten Zugriffsmethoden einen objektbasierten Zugriff.

Objektbasierende Speicherlösungen speichern Daten in Verbindung mit den zugehörigen Metadaten auf einem Datenträger in Form von Objekten und nicht in Form von Dateien. Mittels der Vergabe einer eindeutigen Objekt-ID (Hash-Wert), die in den Metadaten des Objekts festgehalten wird, kann das Objekt eindeutig identifiziert werden. Der Zugriff auf einen objektbasierenden Speicher erfolgt über eine führende Anwendung. Die Anwendung greift hierbei über eine spezielle API und deren mögliche Kommandos oder direkt per IP auf den Objekt-Storage zu. Im Falle eines Zugriffs per API muss die führende Applikation die herstellerspezifische API des gewählten Objekt-Storage unterstützen.

Objekt-Storage wird vor allem im Bereich Archivierung, Dokumentenmanagement und beim Ablegen von Objekten in einer Cloud eingesetzt.

Cloud-Storage

Im Zusammenhang mit Weiterentwicklungen im Storageumfeld etabliert sich zunehmend auch der Begriff des Cloud-Storage. Hierunter ist Storage für die Cloud-Nutzung zu verstehen. Die Speicherlösung an sich bleibt dabei weitgehend unverändert, jedoch liegt eine von klassischen SAN - oder NAS -Architekturen abweichende Art des Zugriffs auf die gespeicherten Daten vor. Dieser wird in der Regel mittels Web-Services realisiert.

Prüffragen:

  • Sind bei der Planung der Speicherlösung die Möglichkeiten und Grenzen der verschiedenen Arten von Speicherlösungen für die Verantwortlichen der Institution transparent gemacht worden?

  • Sind die Entscheidungskriterien für die Auswahl einer geeigneten Speicherlösung nachvollziehbar dokumentiert worden?

  • Ist die Entscheidung für die Auswahl der Speicherlösung nachvollziehbar dokumentiert?

Stand: 14. EL Stand 2014