lehrkraefte:blc:informatik:glf4-23:socialmedia-data:start

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
lehrkraefte:blc:informatik:glf4-23:socialmedia-data:start [2023/02/28 08:40]
Ivo Blöchliger [Datenexport]
lehrkraefte:blc:informatik:glf4-23:socialmedia-data:start [2024/02/25 22:43] (current)
Olaf Schnürer
Line 1: Line 1:
 +~~NOTOC~~
 ====== Datenschutz und Datenanalyse ====== ====== Datenschutz und Datenanalyse ======
 ===== Datenexport ===== ===== Datenexport =====
Line 25: Line 26:
   * Python-Dateien (die werden erst in einem Editor farbig dargestellt)   * Python-Dateien (die werden erst in einem Editor farbig dargestellt)
   * HTML-Dateien (Aufbau von Webseiten, drücken Sie mal Ctrl-U, um den Seitenquelltext anzuzeigen)   * HTML-Dateien (Aufbau von Webseiten, drücken Sie mal Ctrl-U, um den Seitenquelltext anzuzeigen)
-  * [[https://de.wikipedia.org/wiki/CSV_(Dateiformat)|CSV (Comma separated values)]]. Durch Kommas (oder für deutsches Excel durch Strichpunkte) getrennte Werte, zeilenweise. Kann mit einer Tabellekalkulation gelesen und geschrieben werden.+  * [[https://de.wikipedia.org/wiki/CSV_(Dateiformat)|CSV (Comma separated values)]]. Durch Kommas (oder für deutsches Excel durch Strichpunkte) getrennte Werte, zeilenweise. Kann mit einer Tabellenkalkulationssoftware gelesen und geschrieben werden.
   * Markup-Language (z.B. diese Seite wurde damit geschrieben, siehe Knopf «Seitenquelltext» rechts)   * Markup-Language (z.B. diese Seite wurde damit geschrieben, siehe Knopf «Seitenquelltext» rechts)
   * [[https://de.wikipedia.org/wiki/JavaScript_Object_Notation|JSON (JavaScript Object Notation)]]. Maschinenlesbares Datenformat, das auch Menschen lesen können.   * [[https://de.wikipedia.org/wiki/JavaScript_Object_Notation|JSON (JavaScript Object Notation)]]. Maschinenlesbares Datenformat, das auch Menschen lesen können.
Line 50: Line 51:
  
 print('mydata[1]["name"] =', mydata[1]["name"]) print('mydata[1]["name"] =', mydata[1]["name"])
 +# oder (fast) dasselbe etwas kürzer mit sogenannten f-strings (= formatted strings):
 +print(f'{mydata[1]["name"]=}')
 print('mydata[0]["test"] =', mydata[0]["test"]) print('mydata[0]["test"] =', mydata[0]["test"])
 </code> </code>
Line 86: Line 89:
 </hidden> </hidden>
 </WRAP> </WRAP>
- 
- 
-===== Datenanalyse ===== 
-Wir werden die Daten erst einmal in einer Tabellenkalkulation (z.B. Excel) analysieren. Dazu müssen die Daten aber erst in ein Format konvertiert werden, das von Excel auch gelesen werden kann. Dazu verwenden wir einfach CSV-Dateien, die sind am einfachsten zu erzeugen. 
- 
-==== Konvertierung ==== 
- 
-<WRAP todo> 
- 
-  * Speichern Sie folgendes Python-Script im gleichen Verzeichnis wie Ihre YouTube-Daten: {{lehrkraefte:blc:informatik:glf4-23:socialmedia-data:youtube-json-to-csv-convert.py}} 
-  * Falls Sie keine eigene YouTube-Daten (oder andere Daten im JSON-Format haben), können Sie folgende Daten verwenden: {{lehrkraefte:blc:informatik:glf4-23:socialmedia-data:old-data.json.zip}}. 
-  * In der git-bash, navigieren Sie in das Verzeichnis, in dem die Datei ''watch-history.json'' liegt und führen Sie das Python-Script ''youtube-json-to-csv-convert.py'' aus. 
-  * Öffnen Sie die generierte CSV-Datei in Excel 
- 
-<WRAP center round tip 60%> 
-Dazu gibt einen Screencast: [[https://fginfo.ksbg.ch/~ivo/videos/informatik/vierte-klasse-2023/04-youtube-json-to-csv.mp4|Direktlink]] oder auf [[https://bldsg-my.sharepoint.com/:v:/g/personal/ivo_bloechliger_ksbg_ch/Edoi9blJy7pEp5UvqddapyUBSdxhVJpqF53z85KbUryigw?e=QWf7Q1|SharePoint]]. 
-</WRAP> 
- 
-Falls Sie andere Daten haben, versuchen Sie das Konvertierungsscript anzupassen. Fragen Sie Ihren Informatiklehrer und/oder senden Sie ihm einen Auszug Ihrer JSON-Datei (die Struktur der relevanten Einträge muss komplett erhalten sein, dafür reicht aber im Prinzip ein Eintrag). 
- 
-</WRAP> 
- 
-==== Analyse ==== 
-<WRAP todo> 
- 
-Erzeugen Sie eine Pivot-Tabelle dieser Daten, aggregiert nach Wochentag und Stunde. Schauen Sie sich dazu folgendes Video: 
- 
-<WRAP center round tip 60%> 
-Screencast: [[https://fginfo.ksbg.ch/~ivo/videos/informatik/vierte-klasse-2023/05-youtube-csv-excel-pivot-tabelle.mp4|Direktlink]] und auf [[https://bldsg-my.sharepoint.com/:v:/g/personal/ivo_bloechliger_ksbg_ch/EfigS1P1v-RAlZlbh4tTRaEB1WUV9FEnpy5EuoBcinjLrg?e=OHVCcj|SharePoint]]. 
-</WRAP> 
- 
- 
-  * Überprüfen Sie, ob Sonntag oder Montag der erste Wochentag in Excel ist (in meinem LibreOffice ist Sonntag der Tag 1 (wohl weil mein Computer auf US-amerikanisch eingestellt ist). 
-  * Filtern Sie die Daten nach Datum. Vergleichen Sie dazu z.B. den September (Schulbetrieb) mit Juli (Sommerferien). 
- 
-</WRAP> 
- 
  
  
  
  
  • lehrkraefte/blc/informatik/glf4-23/socialmedia-data/start.1677570034.txt.gz
  • Last modified: 2023/02/28 08:40
  • by Ivo Blöchliger