Inside XPS – das andere PDF
Die Themen PDF und XPS tauchen in diesem Blog ja schon häufiger auf. Nun ist mir beim Schmökern auf MSDN aufgefallen, dass XPS-Dateien, genau wie die OpenXML-Dokumente der Office 2007-Anwendungen wie ZIP-Archive organisiert sind. D.h. ich erweitere ganz einfach den Dateinamen einer XPS-Datei um die Dateiendung .ZIP und kann anschließend den Dateiinhalt wie eine ZIP-Datei öffnen und untersuchen. Hier als Beispiel die Datei “Handbuch für den VBA-Worker.xps.zip” als geöffnetes ZIP-Archiv:


- Im Ordner Pages befinden sich die XML-Seiten mit den Beschreibungen der einzelnen Druckseiten des XPS-Dokumentes. Wie für XML-Dateien üblich kann ich die Seiten nach dem Auspacken mit einem gewöhnlichen Texteditor öffnen.
- Die Textzeilen werden über das Attribut UnicodeString gekennzeichnet und ich kann via Suche die Texte ausfindig machen.
- Unter Resources im Ordner Images finde ich die Bilder des Dokumentes – fein säuberlich der Reihe nach aufgelistet.
Falls also mal das PowerPoint-Original verloren gehen sollte: Aus der XPS-Datei lassen sich die Text- und Bildinhalte ganz einfach wieder gewinnen – wenn keine Schutzmechanismen angewendet worden sind. Aber umgekehrt wird ja auch ein Schuh daraus – falls Sie nicht wollen, dass Ihr Text und Ihre Bilder in andere Hände gelangen?