lehrkraefte:blc:informatik:glf4-20:regex-start

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
lehrkraefte:blc:informatik:glf4-20:regex-start [2021/02/15 21:07]
Ivo Blöchliger [Daten nach Wochentagen aggregieren]
lehrkraefte:blc:informatik:glf4-20:regex-start [2021/02/16 11:24] (current)
Ivo Blöchliger [Daten nach Wochentagen oder Tageszeit aggregieren]
Line 1: Line 1:
 ====== Analyse der YouTube-Daten ====== ====== Analyse der YouTube-Daten ======
 +Dieses Beispiel soll zeigen, wohin die Reise führt. Die nötigen Tools und Grundlagen werden wir in den kommenden Wochen erarbeiten.
 ===== Erste Daten-Extraktion ===== ===== Erste Daten-Extraktion =====
-  * Laden Sie folgendes Python-Programm herunter {{ :lehrkraefte:blc:informatik:glf4-20:youtube-date-extractor.py |}} und speichern Sie diese in einem neuen Ordner.+  * Laden Sie folgendes Python-Programm herunter {{ :lehrkraefte:blc:informatik:glf4-20:youtube-date-extractor.py |}} und speichern Sie diese in einem neuen Ordner. Eigene Daten sind wohl im Europäischen Format, dazu verwenden Sie folgende Python-Datei: {{ :lehrkraefte:blc:informatik:glf4-20:youtube-date-extractor-europe.py |}}.
   * Kopieren Sie Ihre Datei watch-history.html in den selben Ordner.   * Kopieren Sie Ihre Datei watch-history.html in den selben Ordner.
     * Wenn Sie keine eigene YouTube-Daten haben, können Sie die Datei {{ :lehrkraefte:blc:informatik:glf4-20:jan14-history.html |}} verwenden.     * Wenn Sie keine eigene YouTube-Daten haben, können Sie die Datei {{ :lehrkraefte:blc:informatik:glf4-20:jan14-history.html |}} verwenden.
Line 9: Line 9:
   * Führen Sie das Python-Programm aus. Dabei wir im selben Ordner eine Datei ''resultat.csv'' generiert.   * Führen Sie das Python-Programm aus. Dabei wir im selben Ordner eine Datei ''resultat.csv'' generiert.
   * Öffnen Sie diese mit Excel und testen Sie, ob diese Datumsangaben auch als Datumsangaben interpretiert werden.   * Öffnen Sie diese mit Excel und testen Sie, ob diese Datumsangaben auch als Datumsangaben interpretiert werden.
-  * Schauen Sie sich das Video mit den Erklärungen zum Code an (siehe Zeilen 4 bis 7 im Python-Programm).+  * Schauen Sie sich das Video mit den Erklärungen zum Code an (siehe Zeilen 4 bis 7 im Python-Programm). Auf [[https://web.microsoftstream.com/video/4c478e5b-609d-4429-bc20-78b9f8abab93|Stream]] oder datensparsam [[https://fginfo.ksbg.ch/~ivo/videos/informatik/vierte-klasse/daten-extraktion-youtube-watchtime-extraktion.mp4|direkt im Browser]].
   * Falls Excel die Datumsangaben nicht korrekt interpretieren kann, passen andernfalls das Ausgabeformat im Python-Programm in der Zeile 62 so an, dass Excel die Datumsangabe korrekt interpretiert.   * Falls Excel die Datumsangaben nicht korrekt interpretieren kann, passen andernfalls das Ausgabeformat im Python-Programm in der Zeile 62 so an, dass Excel die Datumsangabe korrekt interpretiert.
  
Line 19: Line 19:
   * Schauen Sie sich dazu folgendes Video an und modifizieren Sie den Python-Code entsprechend (pausieren Sie wenn nötig): [[https://fginfo.ksbg.ch/~ivo/videos/informatik/vierte-klasse/daten-extraktion-youtube-watchtime-aggregation.mp4|Aggregation nach Wochentagen]], auch auf [[https://web.microsoftstream.com/video/01abb9d3-d4ae-4fbd-9dfd-86313dba7610|Microsoft Stream]].   * Schauen Sie sich dazu folgendes Video an und modifizieren Sie den Python-Code entsprechend (pausieren Sie wenn nötig): [[https://fginfo.ksbg.ch/~ivo/videos/informatik/vierte-klasse/daten-extraktion-youtube-watchtime-aggregation.mp4|Aggregation nach Wochentagen]], auch auf [[https://web.microsoftstream.com/video/01abb9d3-d4ae-4fbd-9dfd-86313dba7610|Microsoft Stream]].
   * Stellen Sie das Resultat dann grafisch in Excel dar.   * Stellen Sie das Resultat dann grafisch in Excel dar.
-  * Ändern Sie dann das Python-Programm so ab, dass Sie nach der Tageszeit (auf Stunden genau) aggregieren. Die Stunde einer Datumzeit-Angabe erhalten Sie mit ''datum.hour()'' (wenn ''datum'' ein ''datetime''-Objekt ist).+  * Ändern Sie dann das Python-Programm so ab, dass Sie nach der Tageszeit (auf Stunden genau) aggregieren. Die Stunde einer Datumzeit-Angabe erhalten Sie mit ''datum.hour'' (wenn ''datum'' ein ''datetime''-Objekt ist)
 +    * Hier ist ein {{ :lehrkraefte:blc:informatik:glf4-20:youtube-date-extractor-aggregator-by-hour.py |Lösungsvorschlag (amerikanisches Datumsformat)}} und ein {{ :lehrkraefte:blc:informatik:glf4-20:youtube-date-extractor-europe-aggregator-by-hour.py |Lösungsvorschlag mit europäischem Datumsformat}} dafür.
   * Stellen Sie wiederum das Resultat grafisch in Excel dar.   * Stellen Sie wiederum das Resultat grafisch in Excel dar.
 +
 +===== Daten nach Datum aggregieren =====
 +Wir können annehmen, die Daten seien chronologisch sortiert. D.h. immer, wenn ein neues Datum angetroffen wird, wird das letzte Datum mit der Anzahl Aufrufen ausgegeben. So erhält man eine Timeline.
 +
 +Wie man das programmiert, erfahren Sie in [[https://fginfo.ksbg.ch/~ivo/videos/informatik/vierte-klasse/daten-extraktion-youtube-watchtime-aggregation-nach-datum.mp4|diesem Video]], das auch auf [[https://web.microsoftstream.com/video/4676ffb2-5649-4700-9862-1f1788da7a4a|Stream]] verfügbar ist.
 +
 +Stellen Sie diese Timeline in Excel dar. Ein mögliche Lösung mit LibreOffice ist in [[https://fginfo.ksbg.ch/~ivo/videos/informatik/vierte-klasse/daten-extraktion-timeline-in-libreoffice-mit-daten-auf-x-achse.mp4|diesem Video]] zu finden, auch auf [[https://web.microsoftstream.com/video/de26b57d-df75-4cd7-ad68-9c906be8ed57|Stream]].
 +
  
  • lehrkraefte/blc/informatik/glf4-20/regex-start.1613419660.txt.gz
  • Last modified: 2021/02/15 21:07
  • by Ivo Blöchliger