lehrkraefte:blc:informatik:glf4-20:umgang-mit-dateien:challenge4

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
lehrkraefte:blc:informatik:glf4-20:umgang-mit-dateien:challenge4 [2021/02/25 08:49]
Ivo Blöchliger [Einführungsbeispiel]
lehrkraefte:blc:informatik:glf4-20:umgang-mit-dateien:challenge4 [2021/03/04 13:31]
Ivo Blöchliger
Line 19: Line 19:
   * Löschen Sie abermals die Zeilen, die ''<a href'' nicht enthalten.   * Löschen Sie abermals die Zeilen, die ''<a href'' nicht enthalten.
   * Führen Sie nun folgende Ersetzung durch, wobei der "Search Mode" auf **Regular Expression** gesetzt werden muss:   * Führen Sie nun folgende Ersetzung durch, wobei der "Search Mode" auf **Regular Expression** gesetzt werden muss:
-    * Ersetzen Sie ''<a href="(.*?)".*?>(.*?)</a.*'' durch ''$2;$1''. //Das ist eine Regular Expression, mehr dazu später// +    * Ersetzen Sie ''<a href=<nowiki>"</nowiki>(.*?)<nowiki>"</nowiki>.*?>(.*?)</a.*'' durch ''$2;$1''. //Das ist eine Regular Expression, mehr dazu später// 
-  * Man stellt fest, dass im Text noch Strichpunkte vorkommen. Diese stehen aber beim ''&quot;'', was für Anführungszeichen steht. Man hat jetzt zwei Möglichkeiten: +  * Man stellt fest, dass im Text noch Strichpunkte vorkommen. Diese stehen aber beim ''&quot;'', was für Anführungszeichen steht. 
-    Entweder Sie ersetzen ''&quot;'' durch ''"'' oder +  Ersetzen Sie ''&quot;'' durch ''<nowiki>"</nowiki>''
-    * Sie machen obige Ersetzung rückgängig und ersetzen statt dessen mit ''"$2";"$1"''.+
   * Als letztes vervollständigen sie die Links durch ''<nowiki>https://fginfo.ksbg.ch</nowiki>'' durch eine geeignete Ersetzung.   * Als letztes vervollständigen sie die Links durch ''<nowiki>https://fginfo.ksbg.ch</nowiki>'' durch eine geeignete Ersetzung.
   * Speichern Sie die Datei als ''links.csv'' und öffnen Sie diese mit Excel. Welches Problem gibt es noch?   * Speichern Sie die Datei als ''links.csv'' und öffnen Sie diese mit Excel. Welches Problem gibt es noch?
   * Schliessen Sie Excel wieder (sonst kann die Datei ''links.csv'' mit Notepad++ nicht wieder gespeichert werden).   * Schliessen Sie Excel wieder (sonst kann die Datei ''links.csv'' mit Notepad++ nicht wieder gespeichert werden).
-  * In Notepad++ und Encoding -> Convert to ANSI und speichern Sie wieder. +  * In Notepad++ kann die Codierung angepasst werden. Im Menu Encoding -> Convert to ANSI. Speichern Sie wieder mit **Ctrl-S**
-  * Öffnen Sie die Datei noch einmal mit Excel und überprüfen Sie, ob das Problem weiter besteht.+  * Öffnen Sie die Datei noch einmal mit Excel und überprüfen Sie, ob das Problem jetzt behoben ist.
 </WRAP> </WRAP>
  
Line 40: Line 39:
 </WRAP> </WRAP>
  
 +===== Regular Expressions =====
 +  * {{lehrkraefte:blc:informatik:glf4-20:umgang-mit-dateien:regexp.pdf|Slides zu Regular Expressions}}
 +
 +
 +===== Summe von Zahlen =====
 +<WRAP todo>
 +Bestimmen Sie die Summe der Zahlen in folgender Datei: {{lehrkraefte:blc:informatik:glf4-20:umgang-mit-dateien:zahlen.txt}}.
 +
 +Beachten Sie, dass
 +alle Zahlen Ganzzahlen sind, d.h. das Komma steht als Trennzeichen für
 +Tausender (amerikanisches Format). Beachten Sie ebenfalls, dass die 
 +Anzahl Leerschläge zwischen den Zahlen variabel sind.
 +
 +Die Summe ist 55'061'026.
 +</WRAP>
 ===== Oh no, pdf ===== ===== Oh no, pdf =====
 <WRAP todo> <WRAP todo>
Line 46: Line 60:
 </WRAP> </WRAP>
  
 +===== HTML-Tabelle nach CSV konvertieren =====
 +<WRAP todo>
 +  * Erstellen Sie eine von Excel lesbare CSV-Datei aus folgender HTML-Tabelle: {{lehrkraefte:blc:informatik:glf4-20:umgang-mit-dateien:table1.html}}
 +  * Berechnen Sie die Summe aller Einträge.
 +Hinweis: Es gibt viele Möglichkeiten, diese Aufgabe zu lösen.
 +</WRAP>
 +
 +<hidden Lösungshilfen>
 +  * Oft ist ein Copy-Paste aus dem Browser einfacher, als die Analyse des HTML-Codes.
 +  * Es gibt online-Tools, die diese Konversionen machen, googeln Sie danach (auch auf English!)
 +  * Das "Problem" sind hier die Tausendertrennzeichen (Apostroph), die müssen wohl oder übel in einem Text-Editor (für Sie Notepad++) ersetzt werden.
 +</hidden>
  
  • lehrkraefte/blc/informatik/glf4-20/umgang-mit-dateien/challenge4.txt
  • Last modified: 2021/03/04 13:33
  • by Ivo Blöchliger