lehrkraefte:blc:informatik:glf19:magicnumbers

Unter Windows wird der Typ einer Datei (fast?) ausschliesslich über die Dateiendung festgelegt. D.h. jede Datei, die mit .pdf endet, wird als PDF-Dokument behandelt und so dargestellt.

Die meisten Datei-Formate haben aber sogenannte “Magic Numbers” oder “file signatures” , d.h. die ersten Bytes sind für jede Datei eines bestimmten Typs gleich. Dieses Merkmal ist zuverlässiger und nicht veränderbar und wird z.T. von anderen System so verwendet.

Öffnet man diverse Dateien mit einem Hex-Editor, z.B. mit frhed.exe (zu finden auf Ihrem Stick im Ordner 'software') stellt man fest, dass die ersten Bytes von .zip, .docx und .xlsx immer gleich sind (nämlich PK in ASCII).

Vergleichen Sie mit https://en.wikipedia.org/wiki/List_of_file_signatures

Moderne Office-Dokumente sind zip-Archive, die mehrere xml-Dokumente enthalten. Dies sind streng strukturierte Text-Dateien und können mit einem Text-Editor gelesen und manipuliert werden.

Aufgabe

Hinweis: Zu dieser Aufgabe gibt es kleine Screencasts, wenn Sie nicht wissen, wie gewisse Manipulationen unter Windows auszuführen sind: https://fginfo.ksbg.ch/~ivo/videos/informatik/w4/

  1. Laden Sie die Daten winner.docx herunter und speichern Sie diese auf Ihrem Stick im Ordner 'aufgaben/W4'.
  2. Öffnen Sie das Dokument, um es anzuschauen, verändern Sie es aber auf keinen Fall. Schliessen Sie Word wieder.
  3. Das Dokument ist effektiv ein zip-Archiv. Entpacken Sie dieses in ein neues Unterverzeichnis. Z.b. starten Sie ein Entpackungsprogramm wie z.B. 7zip und öffenen Sie Datei damit (im Menü Datei → Öffnen, bzw. File → Open). Oder Sie ändern die Dateiendung von .docx auf .zip
  4. Suchen Sie unter den entpackten Dateien jene, die den Text 'Hans Muster' enthält und ersetzen Sie den Namen durch Ihren eigenen. Setzen Sie im Datei-Manager die Such-Option “Inhalt durchsuchen”.
  5. Erstellen Sie dann aus den entpackten Dateien wieder ein zip-Archiv und ändern Sie den Namen auf 'resultat.docx' (ebenfalls auf dem Stick im Verzeichniss 'aufgaben/W4'). Das Dokument sollten Sie jetzt wieder mit Word öffnen können (aber auf keinen Fall darüber speichern).
  6. Laden Sie dann das Python-Programm veryify.py herunter und speichern Sie es ebenfalls im Ordner 'aufgaben/W4'.
  7. Starten Sie 'TigerJython' (zu finden auf Ihrem Stick, 'software/glf/tigerjython.jar').
  8. Öffnen Sie mit TigerJython die Datei 'verify.py'
  9. Passen Sie eventuell den Dateiname und gegebenfalls den Pfad an (falls sich die Dateien nicht im gleichen Verzeichnis befinden würden).
  10. Starten Sie das Program. Es überprüft Ihre Worddatei und liest den Gewinner aus.
  11. Speichern Sie das Dokument 'resultat.docx' auf SharePoint in Ihrem Abgabe Ordner im Unterverzeichnis 'Informatik/W4'.
  12. Melden Sie sich bei mir, wenn Sie damit erfolgreich waren.

Aufgabe

  1. Untersuchen Sie auf gleiche Art und Weise (Entzippen, Öffnen im Text-Editor) ein kleines Excel-Dokument im .xlsx-Format. Erstellen Sie dazu ein Dokument, das einige Zellen mit Text, Zahlen und mindestens eine Formel enthält.
  • lehrkraefte/blc/informatik/glf19/magicnumbers.txt
  • Last modified: 2019/09/10 15:05
  • by Ivo Blöchliger