Bundesamt für Sicherheit in der Informationstechnik

M 6.92 Notfallvorsorge bei Routern und Switches

Verantwortlich für Initiierung: IT-Sicherheitsbeauftragter, Leiter IT

Verantwortlich für Umsetzung: Administrator

Fehlerbehandlung bei Routern und Switches

In jedem IT-Betrieb treten Störungen auf, die von sporadisch auftretenden Fehlverhalten von Komponenten bis zum klar abzugrenzenden Ausfall eines Geräts und dadurch verursachten Netzausfällen reichen können. Grundlage eines sicheren Betriebs ist die Vorbereitung auf Störungssituationen. Hierzu gehören Ausfälle oder Beeinträchtigungen von Hardware und Software beispielsweise auf Grund von Defekten oder Kompromittierungen.

Um in derartigen Situationen effektiv und schnell reagieren zu können, müssen Diagnose und Fehlerbehebung bereits im Vorfeld geplant und vorbereitet werden. Für typische Ausfallszenarien und als Ergebnis von bereits aufgetretenen Störungen sollten Handlungsanweisungen erstellt werden. Kochbuchartige Dokumentationen aller notwendigen Kommandos, ihrer Anwendung mit den zu erwartenden Ausgaben sind in Situationen, die schnelles Handeln erfordern, besonders hilfreich. Hierzu gehören neben Diagnose und Fehlerbehandlung auch die im normalen Betrieb notwendigen Administrationstätigkeiten. Letztere können typischerweise bereits in der vom Hersteller gelieferten Dokumentation enthalten sein. Für die tägliche Praxis ist es allerdings sinnvoll, eine Gesamtdokumentation in Form eines Betriebshandbuchs zu erstellen.

Zu den Voraussetzungen für den Erfolg der Diagnosearbeiten gehört auch eine geeignete Protokollierung während des Betriebs (siehe auch M 4.205 Protokollierung bei Routern und Switches ). Weiterhin sollten für die Fehlerbehandlung geeignete Werkzeuge genutzt werden. Dazu existieren sowohl frei verfügbare als auch kommerzielle Programme, oft auch vom Hersteller der Geräte. Die Verwendung geeigneter Werkzeuge ist umso wichtiger, da mit den Systemkommandos nicht immer alle Konfigurationseinstellungen angezeigt werden. Teilweise werden lediglich die von den Standardeinstellungen abweichenden Daten erfasst.

Die Vorgehensweise bei der Fehlerbehandlung lässt sich in die Bereiche Administration, Performancemessung und Diagnose unterteilen. Nachfolgend werden die jeweils zu berücksichtigenden Aspekte dargestellt:

Administration

In einem Betriebshandbuch sollten alle notwendigen Kommandos zu Administration und Konfiguration dokumentiert werden.

Folgende Bereiche sind zu berücksichtigen:

  • Einrichten von Nutzern, Vergabe von Berechtigungen
  • Update des Betriebssystems
  • Konfiguration
    • Interface
    • Line-Ports
    • Access-Control-Lists
    • Routing
  • Protokollierung

Performance

Folgende Aspekte sollten für Aussagen über die Performance berücksichtigt werden:

  • Eingehender und ausgehender Verkehr (pro Interface oder Port)
  • Durchsatz oder Verkehr pro Interface
  • Statistikinformationen der verwendeten Protokolle

Diagnose

Für die Diagnose sollten alle notwendigen Kommandos und die zu erwartenden Ausgaben zur Anzeige der Zustände des Gesamtsystems, der Interfaces und ihrer Konfiguration dokumentiert sein. Viele Kommandos ermöglichen zudem einen Debug-Modus zu Ausgabe umfangreicher Statusinformationen.

Unter anderem sind folgende Informationen für die Fehlerdiagnose relevant:

  • Status der Netz-Interfaces und der sonstigen Anschlüsse
  • Status der TCP- und UDP-Netzdienste
  • Gesamtkonfiguration als Überblick
  • Prozesse
  • Routing Tabelle und genutzte Routing Protokolle
  • ARP -Tabelle
  • Angemeldete Nutzer
  • DNS und nslookup-Informationen
  • Protokollierung (Nutzung der Log-Level, Interpretation der Log-Informationen)

Als weiterführende Maßnahmen sollte M 2.215 Fehlerbehandlung betrachtet werden.

Notfallvorsorge zur Steigerung der Verfügbarkeit

Durch eine Planung des Vorgehens bei Störungen kann die Zeit zur Wiederherstellung minimiert und unter Umständen eine Lösung überhaupt erst ermöglicht werden. Die Planungen sind mit der übergreifenden Störungs- und Notfallvorsorge abzustimmen und sollten sich am allgemeinen Notfallvorsorgekonzept orientieren (siehe Baustein B 1.3 Notfallmanagement ). Hier werden generelle Vorgaben für Notfalldokumente im gesamten IT-Betrieb formuliert. Diese legen idealerweise einheitliche und verbindliche Anforderungen bez. Aufbau, Inhalt und Form fest.

Folgende Fragestellungen sind für die Notfallvorsorge relevant:

  • Welche Anforderungen bestehen an das Monitoring?
  • Zusammenstellung der Informationen, die von den für den Betrieb der Netzkomponenten verantwortlichen Stellen immer ausgewertet werden (siehe auch Abschnitt Protokollierung)
    • Wie kann eine frühzeitige Störungserkennung sicher gestellt werden?
  • Was sind Gründe für mögliche Störungen?
    • Hardware-Defekte
    • Zu geringe Dimensionierung (Ausfall bei Steigerung der Last)
  • Welche Vorsorgemaßnahmen können getroffen werden?
    • Ersatzgeräte
    • Ersatzteile
    • Implementierung von Failover-Lösungen, die im laufenden Betrieb ein Umschalten auf ein Alternativgerät ermöglichen
    • Wartungsverträge
    • Ausbildung der Mitarbeiter
  • Welche Service Level Agreements bestehen oder sollten getroffen werden?
    • Hardware-Lieferanten (beispielsweise Vor-Ort-Austausch mit Zeitgarantie für bestimmte Komponenten)
    • Interne Service Level Anforderungen
  • Wie ist eine Diagnose durchzuführen?
    • Statusabfragen
    • Anzeige der Konfiguration
    • Prozesse
    • Routing
    • Angemeldete Nutzer
    • Protokollierung
  • Welche Entstörprozeduren müssen durchgeführt werden?
    • Vorgehen bei Ausfall des Komplettsystems (Wiederherstellen von Betriebssystem und Konfiguration)
    • Vorgehen bei Ausfall von Teilkomponenten, bspw. Speicher
  • Wer ist im Schadensfall zu benachrichtigen?
    • Server- und Anwendungsadministration
    • Hardware-Lieferant/Ansprechpartner für den Wartungsvertrag
  • Welche Dokumente müssen im Schadensfall verfügbar sein?
    • Konfiguration
    • ACLs (Regelwerk)
    • Eingerichtete Nutzer und Berechtigungen
    • Passwörter

Die Dokumentation sollte keinesfalls ausschließlich elektronisch vorliegen. Handlungsanweisungen sollten mindestens auch in Papierform existieren. Gegebenenfalls können Konfigurationsdateien auch auf CD-ROM s oder anderen Datenträgern gesondert hinterlegt werden.

  • Wie verläuft der Wiederanlauf?
    • Abhängigkeiten zu anderen Netzkomponenten bzw. Bereichen des IT-Verbunds
    • Neuinstallation des Betriebssystems und Konfiguration
    • Zurückspielen einer gesicherten Konfiguration
    • Möglichkeiten eines eingeschränkten Betriebs

Die für die Notfallvorsorge notwendigen Vorgehensbeschreibungen sind möglichst sorgfältig zu erstellen und regelmäßig zu erproben. Eventuell müssen variierende Vorgehensweisen bei unterschiedlichen Gerätetypen und Betriebssystemen berücksichtigt werden.

Die wahrscheinlich wichtigste Maßnahme zur Steigerung der Verfügbarkeit ist die Vorhaltung von Ersatzteilen, um bei Hardware-Defekten die Ausfallzeiten zu minimieren. Alternativ oder auch als Ergänzung hierzu können Wartungsverträge mit dem Hersteller abgeschlossen werden, die durch garantierte Reaktions- oder sogar Reparaturzeiten die Verfügbarkeit sicherstellen. Hierdurch lassen sich Kosten für die Lagerhaltung reduzieren oder eine noch höhere Hardwareverfügbarkeit erreichen. Im Rahmen eines solchen Vertrages kann auch die Versorgung mit Software-Updates geregelt werden.

Prüffragen:

  • Sind für Diagnose und Fehlerbehebungen bei Routern und Switches im Vorfeld entsprechende Handlungsanweisungen definiert?

  • Sind die im normalen Betrieb der Router und Switches notwendigen Administrationstätigkeiten in einem Betriebshandbuch definiert?

  • Sind alle für die Diagnose notwendigen Kommandos und die zugehörige Anzeige der Zustände des Gesamtsystems, der Interfaces und ihrer Konfiguration dokumentiert?

  • Existiert ein Konzept für die Notfallvorsorge, das mit der übergreifenden Störungs- und Notfallvorsorge abgestimmt ist?

  • Ist sichergestellt, dass die Dokumentationen zur Notfallvorsorge und die darin enthaltenen Handlungsanweisungen in Papierform existieren?

  • Werden die in der Notfallvorsorge notwendigen Vorgehensbeschreibungen regelmäßig erprobt?

Stand: 13. EL Stand 2013