Bundesamt für Sicherheit in der Informationstechnik

M 2.258 Konsistente Indizierung von Dokumenten bei der Archivierung

Verantwortlich für Initiierung: Archivverwalter, Leiter IT

Verantwortlich für Umsetzung: Administrator, Archivverwalter, Leiter IT

Beim Betrieb eines Archivs ist es wichtig, alle abgelegten Dokumente und Datensätze eindeutig zu referenzieren, um sie bei späteren Archivanfragen korrekt wiederfinden zu können. Zusätzlich bieten Archivsysteme die Möglichkeit von Suchanfragen. Da eine Volltextsuche abhängig von Art und Umfang der archivierten Daten sehr lange dauern kann, speichern Archivsysteme zu jedem Dokument einen separaten Datensatz mit Indexangaben in einer eigenen Suchdatenbank. Struktur und Umfang der Indexangaben sind in der Regel konfigurierbar und sollten die folgenden Eigenschaften aufweisen:

  • Eindeutigkeit: Die Dokumentenbezeichner müssen eindeutig sein.
  • Unterstützung zu erwartender Suchanfragen: Durch die Kontextangaben sollen spätere Suchanfragen beschleunigt werden. Da der spätere Suchkontext nicht feststeht, kann im Vorfeld nur eine Abschätzung späterer Suchanfragen vorgenommen und versucht werden, die Kontextangaben so aussagekräftig wie möglich zu gestalten.
  • Geringer Umfang: Ein geringer Umfang an Indexdaten beschleunigt spätere Suchanfragen, jedoch kann ein zu geringer Umfang der Indexdaten Suchanfragen behindern bzw. das Auffinden von Dokumenten erschweren. Der Umfang der Kontextangaben ist letztlich in Abhängigkeit vom erwarteten Datenvolumen festzulegen.

Diese Parameter müssen grundsätzlich vor der Inbetriebnahme des Archivs festgelegt werden. Trotzdem kann es im Laufe der Zeit notwendig werden, die Eigenschaften zu ändern. Je nach Umfang und Art der Änderung der Indexdaten kann dies eine sehr aufwändige Neuindizierung der Archivdatenbestände erforderlich machen.

Der konkrete Kontext für einzelne zu archivierende Dokumente kann auf unterschiedliche Art und Weise erzeugt werden. Drei Verfahren werden dabei unterschieden:

  • manuelle Erstellung:
    Auf der Ebene des Dokumentenmanagementsystems werden Indexangaben zu jedem Dokument über eine Eingabemaske manuell erzeugt. Hierdurch besteht besonders bei großen Datenmengen die Gefahr, dass inkonsistente Indexangaben erfasst werden.
  • halbautomatische Erzeugung:
    Diese Verfahren automatisieren die Vergabe von Indexdaten, gestatten jedoch eine manuelle Kontrolle und Korrektur.
  • vollautomatische Erzeugung:
    Hierbei werden Dokumentindizes vollautomatisch ohne manuelle Eingriffsmöglichkeit vergeben.

Die Wahl des Verfahrens ist abhängig vom erwarteten Datenvolumen. Werden in unregelmäßigen Abständen einzelne Dokumente archiviert, ist ein manuelles Verfahren auf der Grundlage konkreter Vorgaben zur Erstellung eines Kontextes ausreichend.

Werden regelmäßig große Datenvolumen archiviert, sollte ein halbautomatisches Verfahren zur Erzeugung der Indexdaten gewählt werden. Hier besteht die Möglichkeit, diese Informationen manuell zu kontrollieren und zu korrigieren, bevor Dokument und Dokumentindex archiviert werden und dann gegebenenfalls nicht mehr nachträglich geändert werden können.

Bei der vollautomatischen Erzeugung der Indexdaten können Fehler nicht erkannt bzw. korrigiert werden. Eine eventuelle Fehlzuordnung von zu archivierenden Dokumenten, z. B. zu Geschäftsprozessen, kann dann nicht erkannt oder ausgeschlossen werden. Dieses Verfahren sollte deshalb nur dann angewandt werden, wenn alle Dokumente so strukturiert sind, dass alle Indexdaten in jedem Fall zweifelsfrei und zuverlässig extrahiert werden können.

Prüffragen:

  • Sind alle abgelegten Dokumente und Datensätze beim Betrieb eines Archivs eindeutig referenziert?

  • Wurde die Struktur und der Umfang der Indexangaben des Archivs vor Inbetriebnahme festgelegt?

  • Regelmäßige Archivierung großer Datenvolumen und konfigurierbare Indexangaben: Wird ein halbautomatisches Verfahren zur Indexdatenerzeugung verwendet?

  • Vollautomatische Indexdatenerzeugung: Können alle Indexdaten zuverlässig und zweifelsfrei extrahiert werden?

Stand: 13. EL Stand 2013

Hinweis zur Verwendung von Cookies

Um unsere Webseite für Sie optimal zu gestalten und fortlaufend verbessern zu können, verwenden wir Cookies. Durch die weitere Nutzung der Webseite stimmen Sie der Verwendung von Cookies zu. Weitere Informationen hierzu erhalten Sie in unserer Datenschutzerklärung.

OK