lehrkraefte:ks:ffstat2122:start

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
lehrkraefte:ks:ffstat2122:start [2022/06/10 14:16]
Simon Knaus
lehrkraefte:ks:ffstat2122:start [2023/06/01 09:40] (current)
Simon Knaus
Line 1: Line 1:
 ==== Freifach Statistik ==== ==== Freifach Statistik ====
 +lekti
 +
  
 === Links === === Links ===
Line 5: Line 7:
   * [[https://www.ksbg.ch/fileadmin/kundendaten/Portraet/Dienstleistungen/Informatik/Office_365/ICT_Office365_ProPlus.pdf|Office 365 KSBG]]   * [[https://www.ksbg.ch/fileadmin/kundendaten/Portraet/Dienstleistungen/Informatik/Office_365/ICT_Office365_ProPlus.pdf|Office 365 KSBG]]
   * [[lehrkraefte:ks:ffstat2122:classunisg|Slides Uni]]   * [[lehrkraefte:ks:ffstat2122:classunisg|Slides Uni]]
 +
 +==== Lektion 14 ====
 +=== Ziele ===
 +  * Auswertung Fragebogen
 +  * Besprechung Freifach Statistik
 +
 +=== Aufträge ===
 +  * [[https://bldsg-my.sharepoint.com/:u:/g/personal/simon_knaus_ksbg_ch/EYGR9VHkuSdMs1h-J5_CUKsBm2z8nBGPCz321xhSkHiVHQ?e=OilJzV|Daten]] herunterladen und einlesen und <<inspizieren>>. Was fällt auf? Sind die Daten so realistisch? In R ggf. mit ''summary''
 +  * Analysen auswählen
 +    * Welche Analysen sind in welcher Variabel-Konstellation möglich? (Nominal, ordinale, kardinale Variablen)
 +    * Analysen durchführen und Resultate (Grafiken oder Tabellen) in einem Dokument festhalten
 +  * Ggf. Daten recodieren (s.u.)
 +
 +=== Theorie === 
 +
 +Beim <<Rekodieren>> oder <<recoden>> geht es darum,  Variablen einen anderen Wert zuzuordnen. Gründe können können sein, dass ordinale Daten kardinal interpretiert werden.
 +In Excel geht das am einfachsten mit suchen und ersetzen (Achtung bei der Reihenfolge: Wenn eine Teiltext ein Suchtreffer ist, wird dieser ersetzt). In R gibt es verschieden Möglichkeiten:
 +  * ''gsub'' funktioniert wie suchen und ersetzen in Excel
 +  * Mit Index-Vektoren wie z.B. in [[http://dwoll.de/rexrepos/posts/recode.html#using-index-vectors|dieser Erklärung]].
 +  * Mit ''recode'' wie ebenfalls z.B. in [[http://dwoll.de/rexrepos/posts/recode.html#using-recode-from-package-dplyr|dieser Seite]] erklärt.
 +=== Daten einlesen und recodieren in R ===
 +
 +Idealerweise werden die Zeilenspaltentitel bereits in Excel angepasst. Damit hat man kurze Variabelnamen und man kann dann mit ''read.table(file('clipboard'), sep='\t',header=T)'' die Daten einlesen.
 +
 +Sind die Daten eingelesen, kann mit 
 +<code python>
 +gluecksdata <- read.table(file('clipboard'), sep='\t',header=T)
 +# Recodieren
 +# Annahme die 8. Spalte hat neu den Titel 'allinall'
 +gluecksdata$allinall <- gsub("sehr unglücklich",5,glueckdata$allinall)
 +</code>
 +
 +<hidden Mögliche Lösung>
 +<code>
 +data <- read.table(file("clipboard"),sep="\t",header=T)
 +head(data)
 +library(ggplot2)
 +names(data)
 +#gesamtglück
 +data$overall <- with(data,(insgesamt.+lately.+happylife+happymonth+happyoverall)/5)
 +#glück vs. aussehen
 +ggplot(data,aes(y=overall,x=looks))+geom_point()+geom_smooth(method="lm",se = F)
 +#glück vs. gesundheit
 +ggplot(data,aes(y=overall,x=health))+geom_point()+geom_smooth(method="lm",se = F)
 +#glück vs. sleep
 +ggplot(data,aes(y=overall,x=sleep))+geom_point()+geom_smooth(method="lm",se = F)
 +ggplot(subset(data,sleep<30),aes(y=overall,x=sleep))+geom_point()+geom_smooth(method="lm",se = F)
 +
 +with(subset(data,sleep<30),cor(overall,sleep,use = "pairwise.complete"))
 +ggplot(data,aes(y=overall,x=free))+geom_point()+geom_smooth(method="lm",se = F)
 +ggplot(subset(data,free<30),aes(y=overall,x=free))+geom_point()+geom_smooth(method="lm",se = F)
 +ggplot(data,aes(y=overall,x=social))+geom_point()+geom_smooth(method="lm",se = F)
 +ggplot(subset(data,social<30),aes(y=overall,x=social))+geom_point()+geom_smooth(method="lm",se = F)
 +ggplot(data,aes(y=overall,x=sport))+geom_point()+geom_smooth(method="lm",se = F)
 +ggplot(data,aes(x=overall))+geom_histogram(position = "identity")+facet_grid(gender~.)
 +ggplot(data,aes(x=overall,y=gender))+geom_boxplot()
 +ggplot(data,aes(y=overall,x=age))+geom_point()+geom_smooth(method="lm",se = F)
 +ggplot(data,aes(x=meanin,y=overall))+geom_boxplot()
 +ggplot(data,aes(x=morning,y=overall))+geom_boxplot()
 +ggplot(data,aes(x=morning,y=overall))+geom_violin()
 +ggplot(data,aes(x=important,y=overall))+geom_boxplot()
 +library(corrplot)
 +relvar <- sapply(data,is.numeric)
 +corrplot(cor(subset(data[,relvar],free<30),use="pairwise.complete")) 
 +ggplot(da)
 +
 +
 +</code>
 +</hidden>
  
 ==== Lektion 13 ==== ==== Lektion 13 ====
 +
  
 === Ziele ===  === Ziele === 
 +  * Unser Fragenbogen ist bereit für die Datenerhebung
   * Jede/r kann die Begriffe <<Modellwelt>> (Wahrscheinlichkeit, theoretisch) und <<Beobachtete Welt>> (Statistik, beobachtet) einordnen und umgangssprachlich erklären   * Jede/r kann die Begriffe <<Modellwelt>> (Wahrscheinlichkeit, theoretisch) und <<Beobachtete Welt>> (Statistik, beobachtet) einordnen und umgangssprachlich erklären
   * Jede/r kann den Begriff <<Binomialverteilung>> umgangssprachlich erklären und die theoretische Wahrscheinlichkeit berechnen, dass ein gewisses Phänomen eine bestimmte Anzahl mal auftritt   * Jede/r kann den Begriff <<Binomialverteilung>> umgangssprachlich erklären und die theoretische Wahrscheinlichkeit berechnen, dass ein gewisses Phänomen eine bestimmte Anzahl mal auftritt
Line 14: Line 87:
  
 === Autrag === === Autrag ===
 +  * Den Fragebogen einmal als Proband ausfüllen: [[https://forms.office.com/Pages/ResponsePage.aspx?id=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UQVU1TURWMFpIUVlINzFHT0cyNVU3NEFCViQlQCNjPTEu|Link]] zur Probandensicht
 +  * Ggf. den Fragenbogen anpassen. [[https://forms.office.com/Pages/ShareFormPage.aspx?id=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UQVU1TURWMFpIUVlINzFHT0cyNVU3NEFCViQlQCNjPTEu&sharetoken=QpyAKCywk8Zxv7tPgGki|Link zum Duplizieren]] des Fragenbogens.
   * Dem Lehrer zuhören und anschliessend die Wandtafel fotografieren.   * Dem Lehrer zuhören und anschliessend die Wandtafel fotografieren.
   * Experimente (Statistik) versus Theorie (Wahrscheinlichkeit)   * Experimente (Statistik) versus Theorie (Wahrscheinlichkeit)
Line 48: Line 123:
 ==== Lektion 11 ==== ==== Lektion 11 ====
 === Ziele === === Ziele ===
-  * Jede/r kann die $Z$-transformierte (standardisierte) eines Merkmals ausrechnen.+  * Jede/r kann die $Z$-Transformierte (standardisierte) eines Merkmals ausrechnen.
   * Jede/r kann auf Grund von Histogrammen der $Z$-transformierten Merkmale entscheiden, ob ein Merkmal normalverteilt ist.   * Jede/r kann auf Grund von Histogrammen der $Z$-transformierten Merkmale entscheiden, ob ein Merkmal normalverteilt ist.
   * Optional: Jede/r kann die Wahrscheinlichkeit berechnen, dass ein Merkmal innerhalb / ausserhalb eines Intervalls zu liegen kommt.   * Optional: Jede/r kann die Wahrscheinlichkeit berechnen, dass ein Merkmal innerhalb / ausserhalb eines Intervalls zu liegen kommt.
Line 445: Line 520:
     * Die BMW Boxplots den BMW Histogrammen zuordnen     * Die BMW Boxplots den BMW Histogrammen zuordnen
     * Die BMW Mittelwerte, Standardabweichungen, IQA, Median und $Q_{30\%}$ den Histogrammen und Boxplots zuordnen     * Die BMW Mittelwerte, Standardabweichungen, IQA, Median und $Q_{30\%}$ den Histogrammen und Boxplots zuordnen
-  * Ein Beispiel konstruieren, bei dem Median grösser als Mittelwert ist. +  * Anwendungen des Boxplots 
-  * Eine erhobene Grösse ersinnen, bei der Median (oder ein anderes Quantil) mehr interessiert als der Mittelwert und umgekehrt.+    * Abschnitt unten zu "Anwendungen Boxplot durchgehen 
 +    * Ein Beispiel konstruieren, bei dem Median grösser als Mittelwert ist. 
 +    * Eine erhobene Grösse ausdenken, bei der Median (oder ein anderes Quantil) mehr interessiert als der Mittelwert und umgekehrt.
 === Boxplot === === Boxplot ===
  
  • lehrkraefte/ks/ffstat2122/start.1654863380.txt.gz
  • Last modified: 2022/06/10 14:16
  • by Simon Knaus