lehrkraefte:blc:informatik:glf4-20:umgang-mit-dateien:challenge2

This is an old revision of the document!


Challenge 2: CSV-Dateien, Suchen/Ersetzen mit NotePad++

Eine CSV-Datei ist eine Text-Datei, die mit jedem Text-Editor (nicht Word!) bearbeitet werden kann. Eine solche Datei enthält zeilenweise die Einträge einer Tabelle, die durch Kommas getrennt sind (CSV steht für Comma separated value).

Das Problem ist, dass in Deutschland ein Dezimalkomma anstatt eines Dezimalpunktes verwendet wird. Darum wird in der deutschen Version von Excel der Strichpunkt ';' als Trennzeichnen verwendet.

Beim Export der persönlichen Daten von Netflix erhält man eine CSV-Datei, deren Einträge durch Kommas getrennt sind und darum lässt sich die Datei nicht ohne Weiteres importieren.

Ziel dieser Challenge ist es, dass Sie eine solche Datei selbständig anpassen können, damit der Import in Excel klappt.

  • Speichern Sie folgende Datei im challenges-Ordner (unter genau diesem Namen): komma01.csv
  • Öffnen Sie die Datei in Excel und stellen Sie fest, dass die Einträge nicht wie gewünscht sind. Die ganze Zeile steht jeweils in der ersten Zelle.
  • Starten Sie NotePad++ und arrangieren Sie die Fenster wieder so, dass der Browser und der Text-Editor (NotePad++) sichtbar sind.
  • Öffnen Sie die CSV-Datei komma01.csv in NotePad++ (Datei→Öffnen).
  • Lassen Sie alle Kommas durch Strichpunkte ersetzen und speichern Sie die Datei und dem neuen Namen strichpunkt01.csv (exakt genau so) ebenfalls im Ordner challenges.
  • Öffnen Sie die neue Datei in Excel und berechnen Sie die Summe aller Zahlen in der Tabelle und überprüfen Sie, ob diese 12345 beträgt.
  • Speichern Sie die Datei komma02.csv in den Ordner challenges.
  • Öffnen Sie die Datei mit NotePad++.
  • Einfach alle Kommas durch Strichpunkte zu ersetzen, funkioniert hier nicht. Warum? Wenn Sie nicht verstehen warum, probieren Sie es aus und öffnen dann die neue Datei in Excel.
  • Sie müssen erst die Strickpunkte durch ein anderes geeignetes Zeichen ersetzen, z.B. den Bodenstrich (Underscore) _. Ein geeignetes Zeichen ist eines, das sonst nicht in der Datei verwendet wird.
  • Speichern Sie die korrigierte Datei unter dem Namen strichpunkt02.csv und überprüfen Sie, dass die Datei korrekt in Excel geladen wird.
  • lehrkraefte/blc/informatik/glf4-20/umgang-mit-dateien/challenge2.1613939170.txt.gz
  • Last modified: 2021/02/21 21:26
  • by Ivo Blöchliger