Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
lehrkraefte:blc:informatik:glf4-23:socialmedia-data:start [2023/02/22 12:00] Ivo Blöchliger [Text-Dateien] |
lehrkraefte:blc:informatik:glf4-23:socialmedia-data:start [2024/02/25 22:43] (current) Olaf Schnürer |
||
---|---|---|---|
Line 1: | Line 1: | ||
+ | ~~NOTOC~~ | ||
====== Datenschutz und Datenanalyse ====== | ====== Datenschutz und Datenanalyse ====== | ||
+ | ===== Datenexport ===== | ||
+ | Wenn möglich, exportieren Sie die Daten im JSON-Format. Das ist zwar «einfach so» nicht so schön anzuschauen wie eine HTML-Datei, dafür sind die Daten sehr einfach von einem Programm lesbar und bearbeitbar. | ||
+ | * **YouTube**: | ||
+ | * **Instagram**: | ||
+ | * **Twitter**: | ||
+ | * TikTok? Facebook? Snapchat? | ||
+ | |||
+ | <WRAP center round important 60%> | ||
+ | Wichtig! Speichern Sie Ihre persönlichen Daten **nicht auf C:\ofi**, weil andere Benutzer diese Daten lesen könnten. Speichern Sie diese auf Ihrem Laufwerk H:\ oder auf einem USB-Stick. | ||
+ | </ | ||
+ | |||
+ | Wenn der Download zu gross ist, passen Sie den Download-Ordern im Browser wie folgt an: | ||
+ | * «Drei Punkte Menu oben rechts» | ||
+ | * Einstellungen | ||
+ | * Downloads | ||
+ | * Ort: Anpassen auf Ihren Stick (oder c: | ||
+ | ===== Linux, OpenSource und was ist überhaupt ein Betriebssystem ===== | ||
+ | * [[.: | ||
===== Datenformate ===== | ===== Datenformate ===== | ||
+ | |||
==== Text-Dateien ==== | ==== Text-Dateien ==== | ||
- | Text-Dateien enthalten nur Text (als Folge von Buchstaben) aber keine Formatierung. Beispiele dafür sind: | + | Text-Dateien enthalten nur Text (als Folge von Buchstaben) aber keine Formatierung |
* Python-Dateien (die werden erst in einem Editor farbig dargestellt) | * Python-Dateien (die werden erst in einem Editor farbig dargestellt) | ||
* HTML-Dateien (Aufbau von Webseiten, drücken Sie mal Ctrl-U, um den Seitenquelltext anzuzeigen) | * HTML-Dateien (Aufbau von Webseiten, drücken Sie mal Ctrl-U, um den Seitenquelltext anzuzeigen) | ||
- | * [[https:// | + | * [[https:// |
- | * [[https:// | + | |
* Markup-Language (z.B. diese Seite wurde damit geschrieben, | * Markup-Language (z.B. diese Seite wurde damit geschrieben, | ||
+ | * [[https:// | ||
<WRAP todo> | <WRAP todo> | ||
- | Gegeben ist folgende JSON-Datei: | + | * Legen Sie ein Verzeichnis '' |
- | <code json> | + | |
+ | < | ||
[ | [ | ||
| | ||
Line 23: | Line 44: | ||
] | ] | ||
</ | </ | ||
- | Die Datei wird in Python | + | <code python einlesen.py> |
+ | import json | ||
+ | |||
+ | with open(" | ||
+ | mydata = json.load(f) | ||
+ | |||
+ | print(' | ||
+ | # oder (fast) dasselbe etwas kürzer mit sogenannten f-strings (= formatted strings): | ||
+ | print(f' | ||
+ | print(' | ||
+ | </ | ||
+ | |||
+ | Die Datei '' | ||
+ | Mit Hilfe vom Programm (oder durch «logisches Schlussfolgern») beantworten Sie folgende Fragen. Dafür soll der Python-Code auch entsprechend verändert und erweitert werden. | ||
* Welchen Wert hat < | * Welchen Wert hat < | ||
* Welchen Wert hat < | * Welchen Wert hat < | ||
Line 34: | Line 69: | ||
* < | * < | ||
* < | * < | ||
- | </ | ||
- | </ | ||
- | ===== Datenexport ===== | + | <code python einlesen-loesung.py> |
- | Wenn möglich, exportieren Sie die Daten im JSON-Format. Das ist zwar «einfach so» nicht so schön anzuschauen wie eine HTML-Datei, dafür sind die Daten sehr einfach von einem Programm lesbar und bearbeitbar. | + | import json |
- | * **YouTube**: | + | with open(" |
- | * **Instagram**: | + | |
- | * **Twitter**: | + | |
- | * TikTok? Facebook? Snapchat? | + | |
- | ===== Datenanalyse ===== | + | print(' |
- | Wir werden die Daten vor allem in einer Tabellenkalkulation | + | # print(' |
+ | print(' | ||
- | ==== Konvertierung ==== | + | print(" |
+ | print(mydata[1][" | ||
+ | mydata[1][" | ||
- | <WRAP todo> | + | print('Nachher mydata[1][" |
- | + | print(mydata[1][" | |
- | * Speichern Sie folgendes Python-Script im gleichen Verzeichnis wie Ihre YouTube-Daten: | + | </code> |
- | * In der git-bash, navigieren Sie in das Verzeichnis, | + | </hidden> |
- | * Öffnen Sie die generierte CSV-Datei in Excel | + | |
- | + | ||
- | <WRAP center round tip 60%> | + | |
- | Dazu gibt einen Screencast: [[https:// | + | |
</ | </ | ||
- | |||
- | </ | ||
- | |||
- | ==== Analyse ==== | ||
- | <WRAP todo> | ||
- | Falls Sie keine eigenen Daten im CSV-Format haben, können Sie folgende Daten analysieren (Auszug meiner YouTube-Daten): | ||
- | |||
- | Erzeugen Sie eine Pivot-Tabelle dieser Daten, aggregiert nach Wochentag und Stunde. Schauen Sie sich dazu folgendes Video: | ||
- | |||
- | <WRAP center round tip 60%> | ||
- | Screencast: [[https:// | ||
- | </ | ||
- | |||
- | |||
- | * Überprüfen Sie, ob Sonntag oder Montag der erste Wochentag in Excel ist (in LibreOffice ist Sonntag der Tag 1) | ||
- | * Filtern Sie die Daten nach Datum. Vergleichen Sie dazu z.B. den September (Schulbetrieb) mit Juli (Sommerferien). | ||
- | |||
- | </ | ||
- | |||