lehrkraefte:blc:informatik:glf19:magicnumbers

This is an old revision of the document!


Unter Windows wird der Typ einer Datei (fast?) ausschliesslich über die Dateiendung festgelegt. D.h. jede Datei, die mit .pdf endet, wird als PDF-Dokument behandelt und so dargestellt.

Die meisten Datei-Formate haben aber sogenannte “Magic Numbers” oder “file signatures” , d.h. die ersten Bytes sind für jede Datei eines bestimmten Typs gleich. Dieses Merkmal ist zuverlässiger und nicht veränderbar und wird z.T. von anderen System so verwendet.

Aufgabe

  1. Kopieren Sie je mindestens eine Datei folgender Typen in den Ordner aufgaben/W4 auf Ihren USB-Stick:
    • .png
    • .jpg
    • .gif
    • .pdf
    • .zip
    • .docx
    • .xlsx
  2. Starten Sie den Hex-Editor frhed (zu finden auf Ihrem Stick im Ordner 'software') und öffnen Sie damit die obigen Dateien. Finden Sie damit die Magic numbers und vergleichen Sie mit https://en.wikipedia.org/wiki/List_of_file_signatures
  3. Was ist mit den Magic numbers von .zip, .docx und .xlsx? Was ist Ihre Vermutung? Können Sie Ihre Vermutung bestätigen?

Moderne Office-Dokumente sind zip-Archive, die mehrere xml-Dokumente enthalten. Dies sind streng strukturierte Text-Dateien und können mit einem Text-Editor gelesen und manipuliert werden.

Aufgabe

  1. Laden Sie die Daten winner.docx herunter und speichern Sie diese auf Ihrem Stick im Ordner 'aufgaben/W4'.
  2. Öffnen Sie das Dokument, um es anzuschauen, verändern Sie es aber auf keinen Fall.
  3. Das Dokument ist effektiv ein zip-Archiv. Entpacken Sie dieses.
  4. Z.b. starten Sie ein Entpackungsprogramm wie z.B. 7zip und öffenen Sie Datei damit (im Menü Datei → Öffnen, bzw. File → Open).
  5. Oder Sie ändern die Dateiendung von .docx auf .zip
  6. Suchen Sie unter den entpackten Dateien jene, die den Text 'Hans Muster' enthält und ersetzen Sie den Namen durch Ihren eigenen.
  7. Hinweis: Setzen Sie im Datei-Manager die Such-Option “Inhalt durchsuchen”.
  8. Erstellen Sie dann aus den entpackten Dateien wieder ein zip-Archiv und ändern Sie den Namen auf 'resultat.docx' (ebenfalls auf dem Stick im Verzeichniss 'aufgaben/W4'). Das Dokument sollten Sie jetzt wieder mit Word öffnen können (aber auf keinen Fall darüber speichern).
  9. Laden Sie dann das Python-Programm veryify.py herunter und speichern Sie es ebenfalls im Ordner 'aufgaben/W4'.
  10. Starten Sie 'TigerJython' (zu finden auf Ihrem Stick, 'software/glf/tigerjython.jar').
  11. Öffnen Sie mit TigerJython die Datei 'verify.py'
  12. Passen Sie eventuell den Dateiname und gegebenfalls den Pfad an (falls sich die Dateien nicht im gleichen Verzeichnis befinden würden).
  13. Starten Sie das Program. Es überprüft Ihre Worddatei und liest den Gewinner aus.

Aufgabe

  1. Untersuchen Sie auf gleiche Art und Weise (Entzippen, Öffnen im Text-Editor) ein kleines Excel-Dokument im .xlsx-Format. Erstellen Sie dazu ein Dokument, das einige Zellen mit Text, Zahlen und mindestens eine Formel enthält.
  • lehrkraefte/blc/informatik/glf19/magicnumbers.1567412844.txt.gz
  • Last modified: 2019/09/02 10:27
  • by Ivo Blöchliger