Bundesamt für Sicherheit in der Informationstechnik

M 2.244 Ermittlung der technischen Einflussfaktoren für die elektronische Archivierung

Verantwortlich für Initiierung: IT-Sicherheitsbeauftragter

Verantwortlich für Umsetzung: Archivverwalter, IT-Sicherheitsbeauftragter

Bevor eine Entscheidung getroffen werden kann, welche Verfahren und Produkte für die elektronische Archivierung eingesetzt werden sollen, müssen eine Reihe von technischen Einflussfaktoren ermittelt werden. Dazu sollten auch die Eigentümer der zu archivierenden Daten befragt werden, also beispielsweise die Verantwortlichen der einzelnen IT-Systeme bzw. IT-Anwendungen und die Systemadministratoren. Die Ergebnisse sind nachvollziehbar im Archivierungskonzept (siehe M 2.243 Entwicklung des Archivierungskonzepts ) zu dokumentieren. Die für die elektronische Archivierung maßgeblichen technischen Einflussfaktoren sind unter anderem

  • das zu erwartende Datenaufkommen,
  • die Dateiformate der zu archivierenden Dokumente,
  • das Änderungsvolumen und Versionierung,
  • die Aufbewahrungsdauer der Dokumente,
  • die Zahl und Art der Zugriffe,
  • die vorhandene IT-Einsatzumgebung sowie
  • zu beachtende Normen und Standards.

Die angegebenen Einflussfaktoren sind nachfolgend detaillierter dargestellt:

Zu erwartendes Datenaufkommen

Ein wesentliches Kriterium für die Auswahl elektronischer Archivsysteme ist die Größe der zu archivierenden Dateien und das in Zukunft zu erwartende Datenaufkommen. Dies kann typischerweise nur großzügig abgeschätzt werden.

Die Dateigröße von Dokumenten hängt dabei auch sehr stark von der Wahl des Dateiformates und dem Umfang der Rendition (siehe weiter unten) ab.

Dateiformate der zu speichernden Dokumente

Je nach Wahl des Archivsystems können in diesem grundsätzlich alle verwendeten Dateiformate abgelegt werden, z. B. die in Büroumgebungen üblichen Formate (DOC, PDF, RTF, ASCII , ZIP, etc.) oder auch Bild- und Tondateien (JPG, GIF, WAV, MPEG, etc). Besondere Bedeutung erhalten bei der Archivierung jedoch Dateiformate, die eine langfristige Stabilität hinsichtlich der Syntax und Semantik der Daten bieten (wie z. B. SGML, XML oder auch HTML) oder Bilddateien, die ein exaktes Abbild des ehemals vorhandenen Papierdokuments darstellen können (z. B. TIFF). Die einzelnen Datenformate sind in Maßnahme M 4.170 Auswahl geeigneter Datenformate für die Archivierung von Dokumenten detailliert beschrieben.

Bei der elektronischen Archivierung haben sich in der Vergangenheit mehrere Dateiformate etabliert, die eine unterschiedliche Eignung für künftige Verwendungszwecke der Daten aufweisen. Häufig kann oder soll jedoch der spätere Verwendungszweck nicht festgelegt werden. In so einem Fall ist aber nicht vorhersagbar, welches das beste Datenformat für die spätere Verwendung ist. Ebenso häufig bestehen bereits zum Zeitpunkt der Datenspeicherung konkurrierende Anforderungen an die Wahl des Dateiformates, die sich aus den unterschiedlichen Verwendungszwecken ergeben. Deshalb hat es sich, vor allem bei der Langzeitarchivierung, als vorteilhaft erwiesen, Dokumente in mehreren Dateiformaten gleichzeitig zu archivieren. Die Dokumente müssen dazu vorher konvertiert werden. Dieser Vorgang wird als Rendition bezeichnet. Bei der Rendition ist jedoch auf eine genaue Dokumentation der Verfahrensweise zu achten. Informationen über das Originalformat müssen mit archiviert werden.

Die Rendition von Dokumenten und anschließende Speicherung in mehreren Dateiformaten wirkt sich unmittelbar auf die für die Archivierung notwendige Speicherkapazität aus.

Änderungsvolumen und Versionstiefe

Bei der Archivierung von Dokumenten ist zu überlegen, welche Änderungen an den Dokumenten im Lauf der Zeit auftreten werden, wie häufig dies zu erwarten ist und wie damit zu verfahren ist. Wenn archivierte Dokumente geändert werden sollen, bestehen folgende Möglichkeiten:

  • Das ursprüngliche Dokument wird durch die geänderte Version ersetzt.
  • Die neue Version des Dokuments wird zusätzlich zur ursprünglichen Version archiviert (Versionierung), wobei unter Umständen nur eine maximale Anzahl von Versionen desselben Dokuments archiviert bleibt (Versionstiefe).

Durch organisationsinterne oder rechtliche Anforderungen kann eine Versionierung der Dokumente gefordert werden. Hier wird insbesondere auf die Maßnahmen M 2.245 Ermittlung der rechtlichen Einflussfaktoren für die elektronische Archivierung und M 2.246 Ermittlung der organisatorischen Einflussfaktoren für die elektronische Archivierung verwiesen.

Eine Versionierung kann auch durch die Wahl des Speichermediums (z. B. WORM - Write Once Read Multiple) erzwungen werden.

Sofern eine Versionierung von Dokumenten vorgenommen wird, muss dies bei der Berechnung der notwendigen Speicherkapazität des Archivsystems berücksichtigt werden.

Aufbewahrungsdauer der Dokumente

Für die Kalkulation der notwendigen Speicherkapazität des Archivsystems ist eine Abschätzung der Aufbewahrungsdauer der archivierten Dokumente unerlässlich. Für die Aufbewahrungsdauer ergeben sich aufgrund rechtlicher oder organisationsinterner Vorgaben minimale, jedoch teilweise auch maximale Speicherfristen, die zu beachten sind.

Die Aufbewahrungsdauer hat jedoch nicht nur Einfluss auf die Speicherkapazität des Archivsystems, sondern auch auf die Auswahl des Speichermediums sowie dessen Entsorgung nach Ablauf der Aufbewahrungsdauer.

Zahl und Art der Zugriffe

Zugriffszahlen sowie die Art der Zugriffe auf das Archivsystem haben Auswirkungen auf die Konfiguration des Archivservers und die Auswahl der Speicherkomponenten.

Als Einflussfaktoren sind daher zu ermitteln:

  • Wie viele Zugriffe werden innerhalb eines vorgegebenen Zeitraums auf das Archivsystem erfolgen?
  • Wie hoch ist der Anteil von Schreibzugriffen gegenüber Lesezugriffen?
  • Welche Antwortzeiten werden verlangt?
  • Erfolgen die Zugriffe direkt von Benutzer- bzw. Clientsystemen auf das Archivsystem oder durch ein übergeordnetes Dokumentenmanagementsystem?
  • Muss das Archivsystem zwischen Zugriffen verschiedener Benutzer unterscheiden oder erfolgt dies durch übergeordnete Komponenten?
  • Muss das Archivsystem mehrere, voneinander getrennte Archive verwalten (Mandantenfähigkeit)?

IT-Einsatzumgebung

Archivsysteme sind typischerweise in komplexere IT-Landschaften eingebettet. Hierdurch ergeben sich technische Anforderungen, z. B. hinsichtlich

  • der Netzanbindung,
  • der verwendbaren Netzprotokolle (deren Definition z. B. bekannt sein muss, wenn die Kommunikationsverbindung über Firewalls geführt wird),
  • Kompatibilität zu anderen Programmen oder IT-Systemen,
  • der Einbindung in Systemmanagement-Umgebungen sowohl zur Administration als auch zur Überwachung des Archivsystems,
  • der Administrations- und Nutzungsschnittstellen sowie
  • der Antwortzeiten des Archivsystems.

Zu beachtende Normen und Standards

Die im Bereich der Archivierung bestehenden Standards konzentrieren sich auf die Bereiche

  • Dateiformate und Kompressionsverfahren,
  • Speichermedien und deren Aufzeichnungsverfahren sowie
  • Dokumentenmanagement-Software.

Systemhersteller erhalten durch die Offenlegung von Schnittstellen, die im Rahmen der Standardisierung erfolgt, die Möglichkeit, eine Kompatibilität von Systemkomponenten, Schnittstellen und Datenformaten herzustellen. Deshalb kann durch die Berücksichtigung von Standards bei der Auswahl von Archivsystemen eine längerfristige Planungs- und Investitionssicherheit gewährleistet werden. Bei den in diesem Baustein empfohlenen Maßnahmen wird auf die derzeit gültigen Standards Bezug genommen.

Für den Anwender bedeutet die Orientierung an Standards eine Verringerung der Abhängigkeit von einzelnen Herstellern, Systemlieferanten und Dienstleistern. Bei den langen Zeiträumen, über die Archivsysteme typischerweise eingesetzt werden, ist dies besonders wichtig, da nicht absehbar ist, wie sich Produktlinien langfristig entwickeln. So könnte sich z. B. bei Insolvenz eines Herstellers proprietärer Speicherkomponenten das Problem ergeben, dass das Archivierungssystem nicht mehr in der bisherigen Art durch Zukauf neuer Speichermedien und -komponenten erweitert werden kann. In Behörden und Unternehmen mit hohem Archivierungsbedarf führt dies typischerweise kurzfristig den Eintritt in die Migrationsphase herbei. Bei Einsatz standardisierter Komponenten kann dagegen einfach ein anderer Lieferant für die betroffene Teilkomponente gewählt werden.

Hinsichtlich Standards ist allerdings zu beachten, dass auch diese mit der Zeit aufgrund neuer technologischer Entwicklungen an Relevanz verlieren und bei Bedarf durch neue Standards ersetzt werden. Diese unterscheiden sich gelegentlich inhaltlich grundlegend, äußerlich aber nur in der Versionsnummer. Zudem besteht auch ein Wettbewerb zwischen unterschiedlichen Standardisierungsgremien und Herstellern, die naturgemäß auf der Suche nach wirtschaftlichem Einfluss am Markt sind, wodurch es auch konkurrierende Standards gibt.

Prinzipiell ist die Archivierung jedoch auch ohne Beachtung von Standards unter Nutzung proprietärer Datei- und Speicherformate möglich, sofern über den Archivierungszeitraum eine ausreichende Wartung und Systembetreuung durch Hersteller und eine Anpassung der Schnittstellen an sich verändernde Anforderungen sichergestellt wird. Es wird jedoch aus obigen Gründen empfohlen, sich bei der Planung von Archivsystemen eng an geltenden Standards für Dateiformate und Schnittstellen zu orientieren.

Bereits bei der Planung eines Archivsystems sollte eine spätere Migration berücksichtigt werden, da sich bei der langfristigen Speicherung von Daten typischerweise zwischendurch die Technik oder die Anforderungen ändern. Besondere Sorgfalt sollte daher auf die Planung und Auswahl von Schnittstellen, Dateiformaten und Index-Datenbank verwendet und alle Entscheidungen nachvollziehbar dokumentiert werden.

Prüffragen:

  • Sind die technischen Einflussfaktoren vor der Entscheidung für ein Archivierungssystem ermittelt und dokumentiert?

  • Werden die Größe der zu archivierenden Daten und das in Zukunft zu erwartende Datenaufkommen abgeschätzt?

  • Wird ermittelt, welche Änderungen, wie häufig an archivierten Dokumenten auftreten werden?

  • Wird die Anzahl und Art der Zugriffe innerhalb eines vorgegebenen Zeitraums auf das Archivsystem ermittelt und die geforderten Antwortzeiten festgelegt?

  • Wird ermittelt, ob das Archivsystem getrennte Archive verwalten und zwischen Benutzern unterscheiden können muss?

  • Wird die Einsatzumgebung des Archivsystems ermittelt?

  • Nutzung proprietärer Datei- und Speicherformate: Wird durch Verträge mit den Herstellern die Wartung, Systembetreuung und Anpassung sichergestellt?

Stand: 13. EL Stand 2013

Hinweis zur Verwendung von Cookies

Um unsere Webseite für Sie optimal zu gestalten und fortlaufend verbessern zu können, verwenden wir Cookies. Durch die weitere Nutzung der Webseite stimmen Sie der Verwendung von Cookies zu. Weitere Informationen hierzu erhalten Sie in unserer Datenschutzerklärung.

OK