Langzeitarchivierung "kopal" erfolgreich gestartet

Das kopal-System für die Langzeitarchivierung digitaler Objekte hat die erste Stufe seines Produktivbetriebs erfolgreich aufgenommen. Das Archivsystem basiert auf der von IBM weiter entwickelten Archivsoftware DIAS und der im Projekt entwickelten Software koLibRI (kopal Library for Retrieval and Ingest).

Die kopal-Projektpartner Deutsche Nationalbibliothek und Niedersächsische Staats- und Universitätsbibliothek (SUB) Göttingen haben bereits rund 31.000 zu archivierende Dokumente in das Archivsystem eingespielt. Darunter befindet sich der größte Teil der elektronischen Hochschulschriften (Dissertationen und Habilitationen), die von nahezu allen deutschen Hochschulen eingeliefert wurden. Diese Online-Hochschulschriften werden seit 1997 elektronisch gesammelt und bilden mit über 47.000 Dokumenten die größte derartige Sammlung in Europa. Der Zuwachs beträgt mittlerweile rund 10.000 Online-Dissertationen pro Jahr. Entsprechend dem wissenschaftlichen Wert dieser Dokumente und ihrer Bedeutung für die Forschung wurden sie als Pilotmaterialien für die Langzeitarchivierung in kopal ausgewählt.

Die SUB Göttingen hat in den letzten Wochen u.a. eine Auswahl der etwa 100.000 auf dem Dokumentenserver der SUB gesammelten Online-Publikationen eingespeist. Die pdf-Dateien stammen von der Georg-August-Universität und des Universitätsverlages sowie weiteren Forschungseinrichtungen. In Kürze wird außerdem damit begonnen, die sechs Millionen TIFF-Images von Originaldokumenten aus den digitalen Sammlungen des Göttinger Digitalisierungszentrums in das Archiv einzuspielen.

Die in kopal entwickelten Open-Source-Tools koLibRI wurden seit der Testphase Ende letzten Jahres optimiert. Sie gewährleisten ein zuverlässiges und in einer kontrollierten Umgebung stattfindendes Einspielen. Auswahl und Einspielen der Pilotmaterialien werden auch dazu genutzt, die Workflows der Partnerbibliotheken für die Bearbeitung digitaler Materialien zu überprüfen und genauer abzustimmen. In einem nächsten Schritt sind diese Arbeitsabläufe an die Erfordernisse eines Einspielbetriebs anzupassen, der künftig auch außerhalb der beteiligten Projektpartner abläuft.

Derzeit werden Komponenten für Administration und Prozess-Monitoring im Archivsystem entwickelt. Es sollen in kopal Migrations- und Emulationsprozesse ermöglicht werden, die eine langfristige Interpretierbarkeit der archivierten Dokumente sicherstellen. Weiteren Interessenten bietet kopal künftig die Möglichkeit, die Bedingungen der Langzeitarchivierung für die eigenen Belange zu evaluieren. Ein entsprechendes Servicemodell befindet sich derzeit in Entwicklung.

Gehostet wird das Archivierungssystem bei der Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen. Das Projekt wird vom Bundesministerium für Bildung und Forschung seit Juli 2004 mit einem Volumen von 4,2 Millionen Euro gefördert. (Detlef Scholz)