Differences

This shows you the differences between two versions of the page.

--- lehrkraefte:ks:ffstat2223 [2023/06/08 12:24]
Simon Knaus
+++ lehrkraefte:ks:ffstat2223 [2024/03/08 13:21]
Simon Knaus [Lektion 04]
@@ Line 1: / Line 1: @@
+==== Lektion 13 ====
+=== Ziele ===
+  * Fragebogen ist ausgewertet
+=== Aufträge ===
+  * Jede:r wählt sich eine Frage resp. Fragestellung, wertet diese aus und stellt sie den anderen vor.
+   * Erste Runde: Welche Fragen interessieren?
+   * Zweite Runde: Wie kann ich diese beantworten?]
+   * Bitte eure Analysen [[https://bldsg-my.sharepoint.com/:f:/g/personal/simon_knaus_ksbg_ch/Eu_V3twDFDpOkiXhUsTYhGYBN5cm2JDP0njLNYF18cJ8qQ|hier hochladen]] und die anderen ebenfalls [[https://bldsg-my.sharepoint.com/:f:/r/personal/simon_knaus_ksbg_ch/Documents/streammovies/ffstat/analysen?csf=1&web=1&e=yOgJKt|dort]] anschauen.
+Orientiert euch für die Aufträge auch am [[lehrkraefte:ks:ffstat2223#begriffe|Glossar]] unten.
+==== Lektion 12 ====
+=== Ziele ===
+  * Unser Fragenbogen ist bereit für die Datenerhebung
+  * Jede/r kann die Begriffe <<Modellwelt>> (Wahrscheinlichkeit, theoretisch) und <<Beobachtete Welt>> (Statistik, beobachtet) einordnen und umgangssprachlich erklären
+  * Jede/r kann den Begriff <<Binomialverteilung>> umgangssprachlich erklären und die theoretische Wahrscheinlichkeit berechnen, dass ein gewisses Phänomen eine bestimmte Anzahl mal auftritt
+  * Fragen zum Freifach: https://forms.office.com/e/AG8wmRmfqh
+=== Autrag ===
+  * Den Fragebogen einmal als Proband ausfüllen: [[https://forms.office.com/e/QwyGXe2SqW|Link]] zur Probandensicht
+  * Ggf. den Fragenbogen anpassen. [[https://forms.office.com/Pages/DesignPageV2.aspx?subpage=design&FormId=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UQlpKUTRRMFVYQUxCWEg3RlVXQlYxWkZPSiQlQCNjPTEu&Token=2f7a48a96d444f249203b49b80320843|Link zum Editieren]] des Fragenbogens.
+  * Dem Lehrer zuhören und anschliessend die Wandtafel fotografieren.
+  * Experimente (Statistik) versus Theorie (Wahrscheinlichkeit)
+    * Wirf eine Münze $n$ mal (''=WENN(ZUFALLSZAHL()<0.5;"K";"Z")'' und zähle (''ANZAHL()'' oder ''=ZÄHLEWENN()'') die Anzahl Male <<Kopf>>. Berechne auch die durchschnittliche Anzahl Kopf pro Wurf. Wie ist dieser Durchschnitt in der <<Modellwelt>> zu interpretieren?
+    * Wirf drei Münzen $n$ Mal gleichzeitig und zähle jeweils die Anzahl <<Zahl>>. Fertige ein Histogramm an.
+    * Berechne mit Excel die theoretischen Wahrscheinlichkeiten für eine Binomialverteilung (drei Münzen, $0$, $1$, $2$, $3$ mal Zahl) und vergleiche diese Werte mit dem Histogramm aus der vorigen Aufgabe
+    * Jemand hat 100 mal eine Münze geworfen. Wie gross ist die theoretische Wahrscheinlichkeit, dass man genau 67 mal Kopf beobachtet? Nimm an, dass die Münze ausgeglichen ist.
+    * Schau dir  das [[https://www.youtube.com/watch?v=lgs7d5saFFc| Video]] zur <<Tea Tasting Lady>> an. Überlege dir, welche <<Fehlentscheide>> enstehen können.
+ <hidden Histogramm> Die Zufallsvariable $X$ <<Anzahl Zahl>> kann die Werte $0$, $1$, $2$ und $3$ annehmen. Es geht jetz also darum (siehe Blätter), die relative Häufigkeit $h(x)=\frac{n_x}{n}$ zu berechnen und die Werte aufzuzeichnen
+</hidden>
+<hidden Tipps R>
+Mit R könnte das entweder mit der Funktion ''sample(...)'' gelöst werden oder mit ''ifelse(...)'' und ''runif''. Bei beiden Varianten kann die Wahrscheinlichkeit gewählt werden.
+</hidden>
+=== Erklärungen ===
+Die Formel ''BINOM.VERT'' kann in Excel verwendet werden, um die Wahrscheinlichkeit zu berechnen bei $n$ Durchführungen eines Experiments genau $k$ mal Erfolg zu haben wobei der Erfolg mit Wahrscheinlichkeit $p$ eintritt. Man muss dann ''BINOM.VERT(k;n;p; FALSCH)'' aufrufen. ''FALSCH'' ist dabei notwendig, dass man die Wahrscheinlichkeit erhält. Würde ''WAHR'' stehen, erhielte man die Summe aller Wahrscheinlichkeiten mit Anzahl Erfolgen kleiner gleich $k$.
+In R kann genau das gleiche mit ''dbinom(k, n, p)'' erreicht werden.
 ==== Lektion 11 ====
@@ Line 6: / Line 49: @@
 === Aufträge ===
   * Paarweise: Schaut euch [[https://forms.office.com/|Microsoft Forms]] an. ((Es existieren auch Alternativen, im Schulkontext ist das aber auf Grund der Lage bzgl. Datenschutz die Lösung der Wahl.)) Erstellt einen Fragebogen mit Testfragen, um zu verstehen, wie das Tool funktioniert.
-  * Paarweise: Notiert alle Analysen und Kenngrösse, welche wir im Statistikkurs bereits durchgeführt haben. Notiert diese dann an der Wandtafel. Als Stütze ggf. auch die [[lehrkraefte:ks:ffstat2223#begriffe|Begriffe]] unten.
+  * Paarweise: Notiert alle Analysen und Kenngrösse, welche wir im Statistikkurs bereits durchgeführt haben. Notiert diese <del>dann an der Wandtafel</del>. Als Stütze ggf. auch die [[lehrkraefte:ks:ffstat2223#begriffe|Begriffe]] unten.
   * Jede:r hält Fragen fest, die im Rahmen des <<Projekts>> erhoben werden sollen: [[https://bldsg-my.sharepoint.com/:x:/g/personal/simon_knaus_ksbg_ch/ETaGuECnRo9NkM34L-9Y8w4BcmyLagn-1v8np1F7-72HDg?e=cPIvts|Link zur Fragenerfassung]]. {{ :lehrkraefte:ks:ffstat2223:projekt.png?direct&200 |}} Für die Fragen ist auch zentral, dass ihr die Auswertung <<mitdenkt>>. Welche Auswertungen könnten gemacht werden?
   * Welche Probleme könnten bei der Befragung resp. Auswertung entstehen? Bitte ebenfalls auf Wandtafel notieren.
+=== Ressourcen ===
+  * [[https://de.wikipedia.org/wiki/Big_Five_(Psychologie)|Big Five]] Fragebogen: https://www.lw.uni-leipzig.de/wilhelm-wundt-institut-fuer-psychologie/arbeitsgruppen/persoenlichkeitspsychologie-und-psychologische-diagnostik/persoenlichkeitstest
+  *
 ==== Lektion 10 ====
 === Ziele ===
@@ Line 523: / Line 570: @@
   * Kapitel 7 insb. Kapitel 7.1
 <hidden R-Code>
-<file code>
+<code code>
-#Daten sind aus Excel in die Zwischenablage kopiert.
+# cardata <- read.table(readClipboard(),header = T,sep=';')
-bmw <- read.table(file("clipboard"),sep="\t",header = T)
+head(cardata)
-library(ggplot2)
+unique(cardata$model)
-library(plyr)
+x5 <- cardata$model == "x5"
-ggplot(bmw,aes(x=preis))+geom_histogram()+facet_wrap(~model)+xlab("Preis")+ylab("Anzahl")
+x5  #ein Vektor mit TRUE and FALSE
-names(bmw)
+x5preise <- cardata$preis[x5]
-ddply(bmw,.(model),summarise,median(preis))
+mean(x5preise)
-ddply(bmw,.(model),summarise,mean(preis))
+median(x5preise)
-ddply(bmw,.(model),summarise,sd(preis))
+sd(x5preise)
-ddply(bmw,.(model,zylinder),summarise,mean(preis))
+quantile(x5preise, 0.25) #25% Quantil
-#oder
+quantile(x5preise, c(0.25, 0.75)) #25% Quantil und 75% Quantil
-tapply(bmw$preis,bmw$model,median)
-tapply(bmw$preis,bmw$model,mean)
+library(plyr)  # Zusatzpaket 'plyr' laden (vorgänig mit install.packages('plyr') installieren)
-tapply(bmw$preis,bmw$model,sd)
+head(cardata)  # Erste Zeilen anzeigen
-tapply(bmw$preis,bmw$model,var)
+`?`(ddply  # Hilfe zu ddply
-tapply((bmw$preis,bmw$model,quantile,probs=0.25)
+)
-tapply((bmw$preis,bmw$model,quantile,probs=0.75)
+ddply(cardata, .(model), summarise, preis = mean(preis))  # Mittelwert des Preises nach Modell anzeigen
-tapply((bmw$preis,bmw$model,quantile,probs=0.75)-tapply((bmw$preis,bmw$model,quantile,probs=0.25)
+ddply(cardata, .(model), summarise, preis = median(preis))  # Median des Preises nach Modell anzeigen
-#gibt das gleiche wie
+ddply(cardata, .(model, zylinder), summarise, preis = mean(preis))  # Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen
-tapply(bmw$preis,bmw$model,IQR)
+</code>
-mean(bmw$preis[bmw$model=="x1"])
-</file>
 </hidden>
@@ Line 615: / Line 660: @@
 [[https://web.microsoftstream.com/video/f3892b11-1d93-48d7-b59a-e9e8b0a890ee|Einführung Pivot]]
 <code R  ddplystattpivot.R>
-library(plyr) #Zusatzpaket 'plyr' laden (vorgänig mit install.packages("plyr") installieren)
+setwd("Pfad zum Arbeitsverzeichnis angeben")
-head(cardata) #Erste Zeilen anzeigen
+cardata <- read.csv2("bmw_data.csv")
-?ddply #Hilfe zu ddply
-ddply(cardata,.(model),summarise,preis=mean(preis)) #Mittelwert des Preises nach Modell anzeigen
+# install.packages("plyr") # installiert Paket
-ddply(cardata,.(model),summarise,preis=median(preis)) #Median des Preises nach Modell anzeigen
-ddply(cardata,.(model,zylinder),summarise,preis=mean(preis)) #Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen
+library(plyr)
+# Daten laden
+cardata <- read.csv2("bmw_data.csv")
+library(plyr) # Zusatzpaket 'plyr' laden (vorgänig mit install.packages("plyr") installieren)
+head(cardata) # Erste Zeilen anzeigen
+?ddply # Hilfe zu ddply
+ddply(cardata, .(model), summarise, preis = mean(preis)) # Mittelwert des Preises nach Modell anzeigen
+ddply(cardata, .(model), summarise, preis = median(preis)) # Median des Preises nach Modell anzeigen
+ddply(cardata, .(model, zylinder), summarise, preis = mean(preis)) # Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen
 </code>
@@ Line 696: / Line 750: @@
 |Standardisieren | Zentrierung und Streckung eines Merkmals zu $Z=\frac{X-\mu}{\sigma}$. Es ist dann $\mu_Z=0$ und $\sigma_Z=1$||''scale(...)''|
 |Z-Score | Siehe Standardisieren|||
-<!--
 |Signifikanz | Prozentzahl welche den Fehler erster Art (eines Tests) beschränkt. | | |
 |Test| Eine statistische Entscheidungsregel, welche überprüft, ob ein Resultat zufällig ist oder nicht. | | |
@@ Line 702: / Line 755: @@
 |Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | |
 |$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | |
--->
 </sortable>