Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Last revision Both sides next revision | ||
lehrkraefte:blc:informatik:glf4-20:regex-start [2021/02/15 21:07] Ivo Blöchliger [Daten nach Wochentagen aggregieren] |
lehrkraefte:blc:informatik:glf4-20:regex-start [2021/02/16 10:55] Ivo Blöchliger [Erste Daten-Extraktion] |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Analyse der YouTube-Daten ====== | ====== Analyse der YouTube-Daten ====== | ||
+ | Dieses Beispiel soll zeigen, wohin die Reise führt. Die nötigen Tools und Grundlagen werden wir in den kommenden Wochen erarbeiten. | ||
===== Erste Daten-Extraktion ===== | ===== Erste Daten-Extraktion ===== | ||
- | * Laden Sie folgendes Python-Programm herunter {{ : | + | * Laden Sie folgendes Python-Programm herunter {{ : |
* Kopieren Sie Ihre Datei watch-history.html in den selben Ordner. | * Kopieren Sie Ihre Datei watch-history.html in den selben Ordner. | ||
* Wenn Sie keine eigene YouTube-Daten haben, können Sie die Datei {{ : | * Wenn Sie keine eigene YouTube-Daten haben, können Sie die Datei {{ : | ||
Line 9: | Line 9: | ||
* Führen Sie das Python-Programm aus. Dabei wir im selben Ordner eine Datei '' | * Führen Sie das Python-Programm aus. Dabei wir im selben Ordner eine Datei '' | ||
* Öffnen Sie diese mit Excel und testen Sie, ob diese Datumsangaben auch als Datumsangaben interpretiert werden. | * Öffnen Sie diese mit Excel und testen Sie, ob diese Datumsangaben auch als Datumsangaben interpretiert werden. | ||
- | * Schauen Sie sich das Video mit den Erklärungen zum Code an (siehe Zeilen 4 bis 7 im Python-Programm). | + | * Schauen Sie sich das Video mit den Erklärungen zum Code an (siehe Zeilen 4 bis 7 im Python-Programm). Auf [[https:// |
* Falls Excel die Datumsangaben nicht korrekt interpretieren kann, passen andernfalls das Ausgabeformat im Python-Programm in der Zeile 62 so an, dass Excel die Datumsangabe korrekt interpretiert. | * Falls Excel die Datumsangaben nicht korrekt interpretieren kann, passen andernfalls das Ausgabeformat im Python-Programm in der Zeile 62 so an, dass Excel die Datumsangabe korrekt interpretiert. | ||
Line 19: | Line 19: | ||
* Schauen Sie sich dazu folgendes Video an und modifizieren Sie den Python-Code entsprechend (pausieren Sie wenn nötig): [[https:// | * Schauen Sie sich dazu folgendes Video an und modifizieren Sie den Python-Code entsprechend (pausieren Sie wenn nötig): [[https:// | ||
* Stellen Sie das Resultat dann grafisch in Excel dar. | * Stellen Sie das Resultat dann grafisch in Excel dar. | ||
- | * Ändern Sie dann das Python-Programm so ab, dass Sie nach der Tageszeit (auf Stunden genau) aggregieren. Die Stunde einer Datumzeit-Angabe erhalten Sie mit '' | + | * Ändern Sie dann das Python-Programm so ab, dass Sie nach der Tageszeit (auf Stunden genau) aggregieren. Die Stunde einer Datumzeit-Angabe erhalten Sie mit '' |
+ | * Hier ist ein {{ : | ||
* Stellen Sie wiederum das Resultat grafisch in Excel dar. | * Stellen Sie wiederum das Resultat grafisch in Excel dar. | ||
+ | |||
+ | ===== Daten nach Datum aggregieren ===== | ||
+ | Wir können annehmen, die Daten seien chronologisch sortiert. D.h. immer, wenn ein neues Datum angetroffen wird, wird das letzte Datum mit der Anzahl Aufrufen ausgegeben. So erhält man eine Timeline. | ||
+ | |||
+ | Wie man das programmiert, | ||
+ | |||
+ | Stellen Sie diese Timeline in Excel dar. Ein mögliche Lösung mit LibreOffice ist in [[https:// | ||
+ | |||