Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
lehrkraefte:blc:informatik:glf4-20:regex-start [2021/02/15 20:29] Ivo Blöchliger [Analyse der YouTube-Daten] |
lehrkraefte:blc:informatik:glf4-20:regex-start [2021/02/16 11:24] (current) Ivo Blöchliger [Daten nach Wochentagen oder Tageszeit aggregieren] |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Analyse der YouTube-Daten ====== | ====== Analyse der YouTube-Daten ====== | ||
- | + | Dieses Beispiel soll zeigen, wohin die Reise führt. Die nötigen Tools und Grundlagen werden wir in den kommenden Wochen erarbeiten. | |
- | ===== Vorgehen | + | ===== Erste Daten-Extraktion |
- | * Laden Sie folgende Datei herunter {{ : | + | * Laden Sie folgendes Python-Programm |
- | * Kopieren Sie Ihre Datei watch-history.html | + | * Kopieren Sie Ihre Datei watch-history.html |
+ | * Wenn Sie keine eigene YouTube-Daten haben, können Sie die Datei {{ : | ||
* Starten Sie TigerJython und öffnen Sie in Tigerjython die Datei youtube-date-extractor.py. | * Starten Sie TigerJython und öffnen Sie in Tigerjython die Datei youtube-date-extractor.py. | ||
- | * Passen Sie nötigenfalls den Dateinnamen | + | * Passen Sie nötigenfalls den Dateinamen |
- | * | + | * Führen Sie das Python-Programm aus. Dabei wir im selben Ordner eine Datei '' |
+ | * Öffnen Sie diese mit Excel und testen Sie, ob diese Datumsangaben auch als Datumsangaben interpretiert werden. | ||
+ | * Schauen Sie sich das Video mit den Erklärungen zum Code an (siehe Zeilen 4 bis 7 im Python-Programm). Auf [[https:// | ||
+ | * Falls Excel die Datumsangaben nicht korrekt interpretieren kann, passen andernfalls das Ausgabeformat im Python-Programm in der Zeile 62 so an, dass Excel die Datumsangabe korrekt interpretiert. | ||
+ | |||
+ | ===== Daten nach Wochentagen oder Tageszeit aggregieren ===== | ||
+ | Die Frage ist: Wie viele Videos wurden pro Wochentag geschaut? Können Sie das mit Excel ermitteln? | ||
+ | |||
+ | Gehen sollte es schon, in Python ist es aber schneller, flexibler und auch mit neuen Daten sofort anwendbar. | ||
+ | |||
+ | * Schauen Sie sich dazu folgendes Video an und modifizieren Sie den Python-Code entsprechend (pausieren Sie wenn nötig): [[https:// | ||
+ | * Stellen Sie das Resultat dann grafisch in Excel dar. | ||
+ | * Ändern Sie dann das Python-Programm so ab, dass Sie nach der Tageszeit (auf Stunden genau) aggregieren. Die Stunde einer Datumzeit-Angabe erhalten Sie mit '' | ||
+ | * Hier ist ein {{ : | ||
+ | * Stellen Sie wiederum das Resultat grafisch in Excel dar. | ||
+ | |||
+ | ===== Daten nach Datum aggregieren ===== | ||
+ | Wir können annehmen, die Daten seien chronologisch sortiert. D.h. immer, wenn ein neues Datum angetroffen wird, wird das letzte Datum mit der Anzahl Aufrufen ausgegeben. So erhält man eine Timeline. | ||
+ | |||
+ | Wie man das programmiert, | ||
+ | |||
+ | Stellen Sie diese Timeline in Excel dar. Ein mögliche Lösung mit LibreOffice ist in [[https:// | ||
+ |