LibreOffice & Microsoft Office

Defekte Office-Dokumente in Linux-Distributionen retten

Manuelle Rettung: Als ZIP-Archiv entpacken

Das Open-Document-Format von Libre Office (ODT, ODS, ODP) und Open Office sowie das Format OOXML von Microsoft (DOCX, XSLX, PPTX) bestehen aus einem ZIP-Archiv. Das Archiv enthält mehrere einzelne Dateien für Struktur, Objekte wie Bilder und speichert den Textinhalt in einer XML-Datei ab. Schwer angeschlagene Dokumente können Sie zunächst mit dem Kommandozeilenprogramm zip wie eine beschädigte ZIP-Datei behandeln und mittels der eingebauten Reparaturfunktion in eine neue Datei mit restauriertem Header schreiben. Um eine Datei von Libre Office Writer mit dem Namen „dokument.ods“ so zu behandeln, geben Sie in einem Terminal den Befehl

zip -F dokument.ods --out repariert.ods

ein. Versuchen Sie dann abermals, die so erzeugte Datei „repariert.ods“ mit Libre Office zu öffnen.

Falls das immer noch nicht gelingt, dann gibt es noch einen Reparaturparameter mit einer sehr losen Interpretation des ZIP-Formats:

zip -FF dokument.ods --out repariert.ods

Sollte sich der Datei-Header mit diesem zweiten Befehl reparieren lassen, dann können Sie anschließend wenigstens einige Dateien extrahieren. Hilfreich ist das bei Dokumenten von Libre Office Writer (ODT) und Microsoft Word (DOCX), denn Sie können so zumindest noch Teile des Texts manuell retten. Entpacken Sie dazu die zuvor restaurierte Datei mit dem folgenden Kommando

unzip repariert.ods

Den Textinhalt finden Sie dann bei DOCX-Dateien in der Datei „Document.xml“ im Verzeichnis „Word“. Bei ODT-Dateien liegt der Text als „content.xml“ vor. Es handelt sich in beiden Fällen um Dateien in einer XML-Struktur mit zahlreichen Tags. Für die Ansicht des eigentlichen Inhalts können Sie die XML-Tags mit Hilfe eines Browsers ausblenden: Benennen Sie die Dateiendung von „.xml“ nach „.html“ um, und öffnen Sie die Datei mit Firefox oder Chrome/Chromium. Der Browser präsentiert nun den puren Textinhalt ohne Struktur und Formatierungen, den Sie jetzt in ein neues Dokument kopieren und einfügen können.

Korrekte Sonderzeichen erhalten Sie, wenn Sie die Zeichencodierung zu „Unicode“ umstellen, was in Firefox über das Menü „Ansicht -> Zeichenkodierung -> Unicode“ gelingt und in Chrome/Chromium über das Menüsymbol mit „Weitere Tools -> Codierung -> Unicode (UTF-8)“.

(PC-Welt/ad)