lehrkraefte:ks:ffstat2223

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
lehrkraefte:ks:ffstat2223 [2023/06/08 11:35]
Simon Knaus
lehrkraefte:ks:ffstat2223 [2024/03/08 13:21]
Simon Knaus [Lektion 04]
Line 1: Line 1:
 +==== Lektion 13 ====
 +
 +
 +=== Ziele === 
 +  * Fragebogen ist ausgewertet
 +
 +
 +=== Aufträge ===
 +  * Jede:r wählt sich eine Frage resp. Fragestellung, wertet diese aus und stellt sie den anderen vor.
 +   * Erste Runde: Welche Fragen interessieren?
 +   * Zweite Runde: Wie kann ich diese beantworten?  
 +   * Bitte eure Analysen [[https://bldsg-my.sharepoint.com/:f:/g/personal/simon_knaus_ksbg_ch/Eu_V3twDFDpOkiXhUsTYhGYBN5cm2JDP0njLNYF18cJ8qQ|hier hochladen]] und die anderen ebenfalls [[https://bldsg-my.sharepoint.com/:f:/r/personal/simon_knaus_ksbg_ch/Documents/streammovies/ffstat/analysen?csf=1&web=1&e=yOgJKt|dort]] anschauen.
 +
 +Orientiert euch für die Aufträge auch am [[lehrkraefte:ks:ffstat2223#begriffe|Glossar]] unten.   
 +==== Lektion 12 ====
 +
 +
 +=== Ziele === 
 +  * Unser Fragenbogen ist bereit für die Datenerhebung
 +  * Jede/r kann die Begriffe <<Modellwelt>> (Wahrscheinlichkeit, theoretisch) und <<Beobachtete Welt>> (Statistik, beobachtet) einordnen und umgangssprachlich erklären
 +  * Jede/r kann den Begriff <<Binomialverteilung>> umgangssprachlich erklären und die theoretische Wahrscheinlichkeit berechnen, dass ein gewisses Phänomen eine bestimmte Anzahl mal auftritt
 +  * Fragen zum Freifach: https://forms.office.com/e/AG8wmRmfqh
 +
 +=== Autrag ===
 +  * Den Fragebogen einmal als Proband ausfüllen: [[https://forms.office.com/e/QwyGXe2SqW|Link]] zur Probandensicht
 +  * Ggf. den Fragenbogen anpassen. [[https://forms.office.com/Pages/DesignPageV2.aspx?subpage=design&FormId=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UQlpKUTRRMFVYQUxCWEg3RlVXQlYxWkZPSiQlQCNjPTEu&Token=2f7a48a96d444f249203b49b80320843|Link zum Editieren]] des Fragenbogens.
 +  * Dem Lehrer zuhören und anschliessend die Wandtafel fotografieren.
 +  * Experimente (Statistik) versus Theorie (Wahrscheinlichkeit)
 +    * Wirf eine Münze $n$ mal (''=WENN(ZUFALLSZAHL()<0.5;"K";"Z")'' und zähle (''ANZAHL()'' oder ''=ZÄHLEWENN()'') die Anzahl Male <<Kopf>>. Berechne auch die durchschnittliche Anzahl Kopf pro Wurf. Wie ist dieser Durchschnitt in der <<Modellwelt>> zu interpretieren?
 +    * Wirf drei Münzen $n$ Mal gleichzeitig und zähle jeweils die Anzahl <<Zahl>>. Fertige ein Histogramm an. 
 +    * Berechne mit Excel die theoretischen Wahrscheinlichkeiten für eine Binomialverteilung (drei Münzen, $0$, $1$, $2$, $3$ mal Zahl) und vergleiche diese Werte mit dem Histogramm aus der vorigen Aufgabe
 +    * Jemand hat 100 mal eine Münze geworfen. Wie gross ist die theoretische Wahrscheinlichkeit, dass man genau 67 mal Kopf beobachtet? Nimm an, dass die Münze ausgeglichen ist.
 +    * Schau dir  das [[https://www.youtube.com/watch?v=lgs7d5saFFc| Video]] zur <<Tea Tasting Lady>> an. Überlege dir, welche <<Fehlentscheide>> enstehen können.
 + 
 + <hidden Histogramm> Die Zufallsvariable $X$ <<Anzahl Zahl>> kann die Werte $0$, $1$, $2$ und $3$ annehmen. Es geht jetz also darum (siehe Blätter), die relative Häufigkeit $h(x)=\frac{n_x}{n}$ zu berechnen und die Werte aufzuzeichnen
 +
 +</hidden>
 +<hidden Tipps R>
 +Mit R könnte das entweder mit der Funktion ''sample(...)'' gelöst werden oder mit ''ifelse(...)'' und ''runif''. Bei beiden Varianten kann die Wahrscheinlichkeit gewählt werden.
 +</hidden>
 +=== Erklärungen ===
 +Die Formel ''BINOM.VERT'' kann in Excel verwendet werden, um die Wahrscheinlichkeit zu berechnen bei $n$ Durchführungen eines Experiments genau $k$ mal Erfolg zu haben wobei der Erfolg mit Wahrscheinlichkeit $p$ eintritt. Man muss dann ''BINOM.VERT(k;n;p; FALSCH)'' aufrufen. ''FALSCH'' ist dabei notwendig, dass man die Wahrscheinlichkeit erhält. Würde ''WAHR'' stehen, erhielte man die Summe aller Wahrscheinlichkeiten mit Anzahl Erfolgen kleiner gleich $k$.
 +In R kann genau das gleiche mit ''dbinom(k, n, p)'' erreicht werden.
 ==== Lektion 11 ==== ==== Lektion 11 ====
  
Line 5: Line 48:
  
 === Aufträge === === Aufträge ===
-  * Paarweise: Schaut euch [[https://forms.office.com/|Microsoft Forms]] an. ((Es existieren auch Alternativen, im Schulkontext ist das aber auf Grund der Lage bzgl. Datenschutz die Lösung der Wahl.)) Erstellt einen Fragebogen mit Testfrage, um zu verstehen, wie das Tool funktioniert. +  * Paarweise: Schaut euch [[https://forms.office.com/|Microsoft Forms]] an. ((Es existieren auch Alternativen, im Schulkontext ist das aber auf Grund der Lage bzgl. Datenschutz die Lösung der Wahl.)) Erstellt einen Fragebogen mit Testfragen, um zu verstehen, wie das Tool funktioniert. 
-  * Paarweise: Notiert alle Analysen und Kenngrösse, welche wir im Statistikkurs bereits durchgeführt haben. Notiert diese dann an der Wandtafel. Als Stütze ggf. auch die [[lehrkraefte:ks:ffstat2223#begriffe|Begriffe]] unten.+  * Paarweise: Notiert alle Analysen und Kenngrösse, welche wir im Statistikkurs bereits durchgeführt haben. Notiert diese <del>dann an der Wandtafel</del>. Als Stütze ggf. auch die [[lehrkraefte:ks:ffstat2223#begriffe|Begriffe]] unten.
   * Jede:r hält Fragen fest, die im Rahmen des <<Projekts>> erhoben werden sollen: [[https://bldsg-my.sharepoint.com/:x:/g/personal/simon_knaus_ksbg_ch/ETaGuECnRo9NkM34L-9Y8w4BcmyLagn-1v8np1F7-72HDg?e=cPIvts|Link zur Fragenerfassung]]. {{ :lehrkraefte:ks:ffstat2223:projekt.png?direct&200 |}} Für die Fragen ist auch zentral, dass ihr die Auswertung <<mitdenkt>>. Welche Auswertungen könnten gemacht werden?   * Jede:r hält Fragen fest, die im Rahmen des <<Projekts>> erhoben werden sollen: [[https://bldsg-my.sharepoint.com/:x:/g/personal/simon_knaus_ksbg_ch/ETaGuECnRo9NkM34L-9Y8w4BcmyLagn-1v8np1F7-72HDg?e=cPIvts|Link zur Fragenerfassung]]. {{ :lehrkraefte:ks:ffstat2223:projekt.png?direct&200 |}} Für die Fragen ist auch zentral, dass ihr die Auswertung <<mitdenkt>>. Welche Auswertungen könnten gemacht werden?
   * Welche Probleme könnten bei der Befragung resp. Auswertung entstehen? Bitte ebenfalls auf Wandtafel notieren.   * Welche Probleme könnten bei der Befragung resp. Auswertung entstehen? Bitte ebenfalls auf Wandtafel notieren.
 +
 +=== Ressourcen === 
 +  * [[https://de.wikipedia.org/wiki/Big_Five_(Psychologie)|Big Five]] Fragebogen: https://www.lw.uni-leipzig.de/wilhelm-wundt-institut-fuer-psychologie/arbeitsgruppen/persoenlichkeitspsychologie-und-psychologische-diagnostik/persoenlichkeitstest
 +  * 
 ==== Lektion 10 ==== ==== Lektion 10 ====
 === Ziele === === Ziele ===
Line 523: Line 570:
   * Kapitel 7 insb. Kapitel 7.1   * Kapitel 7 insb. Kapitel 7.1
 <hidden R-Code> <hidden R-Code>
-<file code> +<code code> 
-#Daten sind aus Excel in die Zwischenablage kopiert. +cardata <- read.table(readClipboard(),header T,sep=';'
-bmw <- read.table(file("clipboard"),sep="\t",header T+head(cardata
-library(ggplot2+unique(cardata$model
-library(plyr+x5 <- cardata$model == "x5" 
-ggplot(bmw,aes(x=preis))+geom_histogram()+facet_wrap(~model)+xlab("Preis")+ylab("Anzahl"+x5  #ein Vektor mit TRUE and FALSE 
-names(bmw+x5preise <- cardata$preis[x5] 
-ddply(bmw,.(model),summarise,median(preis)) +mean(x5preise) 
-ddply(bmw,.(model),summarise,mean(preis)) +median(x5preise) 
-ddply(bmw,.(model),summarise,sd(preis)) +sd(x5preise
-ddply(bmw,.(model,zylinder),summarise,mean(preis)) +quantile(x5preise, 0.25#25% Quantil 
-#oder +quantile(x5preisec(0.250.75)) #25% Quantil und 75% Quantil 
-tapply(bmw$preis,bmw$model,median+ 
-tapply(bmw$preis,bmw$model,mean) +library(plyr)  # Zusatzpaket 'plyr' laden (vorgänig mit install.packages('plyr'installieren) 
-tapply(bmw$preis,bmw$model,sd+head(cardata # Erste Zeilen anzeigen 
-tapply(bmw$preis,bmw$model,var) +`?`(ddply  # Hilfe zu ddply 
-tapply((bmw$preis,bmw$model,quantile,probs=0.25) +
-tapply((bmw$preis,bmw$model,quantile,probs=0.75) +ddply(cardata, .(model), summarise, preis = mean(preis))  # Mittelwert des Preises nach Modell anzeigen 
-tapply((bmw$preis,bmw$model,quantile,probs=0.75)-tapply((bmw$preis,bmw$model,quantile,probs=0.25) +ddply(cardata, .(model), summarise, preis median(preis))  # Median des Preises nach Modell anzeigen 
-#gibt das gleiche wie  +ddply(cardata, .(model, zylinder), summarise, preis = mean(preis))  # Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen 
-tapply(bmw$preis,bmw$model,IQR) +</code>
-mean(bmw$preis[bmw$model=="x1"]+
-</file>+
 </hidden> </hidden>
  
Line 615: Line 660:
 [[https://web.microsoftstream.com/video/f3892b11-1d93-48d7-b59a-e9e8b0a890ee|Einführung Pivot]] [[https://web.microsoftstream.com/video/f3892b11-1d93-48d7-b59a-e9e8b0a890ee|Einführung Pivot]]
 <code R  ddplystattpivot.R> <code R  ddplystattpivot.R>
-library(plyr) #Zusatzpaket 'plyr' laden (vorgänig mit install.packages("plyr") installieren) +setwd("Pfad zum Arbeitsverzeichnis angeben"
-head(cardata) #Erste Zeilen anzeigen +cardata <- read.csv2("bmw_data.csv"
-?ddply #Hilfe zu ddply + 
-ddply(cardata,.(model),summarise,preis=mean(preis)) #Mittelwert des Preises nach Modell anzeigen +# install.packages("plyr") # installiert Paket 
-ddply(cardata,.(model),summarise,preis=median(preis)) #Median des Preises nach Modell anzeigen + 
-ddply(cardata,.(model,zylinder),summarise,preis=mean(preis)) #Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen+library(plyr) 
 +# Daten laden 
 +cardata <- read.csv2("bmw_data.csv"
 +library(plyr) # Zusatzpaket 'plyr' laden (vorgänig mit install.packages("plyr") installieren) 
 +head(cardata) # Erste Zeilen anzeigen 
 +?ddply # Hilfe zu ddply 
 +ddply(cardata, .(model), summarise, preis = mean(preis)) # Mittelwert des Preises nach Modell anzeigen 
 +ddply(cardata, .(model), summarise, preis = median(preis)) # Median des Preises nach Modell anzeigen 
 +ddply(cardata, .(model, zylinder), summarise, preis = mean(preis)) # Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen 
 </code> </code>
  
Line 682: Line 736:
 |$\alpha$-Quantil| Zum Prozentrang $\alpha$ gehöriger Wert | ''QUANTIL.INKL()'' | ''quantile(,,type=2)''| |$\alpha$-Quantil| Zum Prozentrang $\alpha$ gehöriger Wert | ''QUANTIL.INKL()'' | ''quantile(,,type=2)''|
 |IQA | Interquartilsabstand. Differenz des 1. und 3. Quartils|| ''QUANTIL.INKL(...;.75)-QUANTIL.INKL(...;.25)''| |IQA | Interquartilsabstand. Differenz des 1. und 3. Quartils|| ''QUANTIL.INKL(...;.75)-QUANTIL.INKL(...;.25)''|
- +|Boxplot |Illustration der Verteilung mit Quartilen | |''boxplot()''|
-|Boxplot|Illustration der Verteilung mit Quartilen | |''boxplot()''|+
 |Outlier | Ausreisser. Eine mögliche Definition für Outlier, sind Werte, die ausserhalb der Whiskers beim Boxplot sind | |Outlier | Ausreisser. Eine mögliche Definition für Outlier, sind Werte, die ausserhalb der Whiskers beim Boxplot sind |
- 
 |Lorenzkurve | Mass zur Konzentration einer Verteilung. Es wir dabei die relative kumulierte Anzahl gegen die relative kumulierte Summe des Merkmals gezeichnet| |Lorenzkurve | Mass zur Konzentration einer Verteilung. Es wir dabei die relative kumulierte Anzahl gegen die relative kumulierte Summe des Merkmals gezeichnet|
 |Gini-Koeffizient| Mass der Konzentration einer Verteilung welches die Fläche misst, welche die Lorenzkurve mit der Winkelhalbierenden einschliesst| |Gini-Koeffizient| Mass der Konzentration einer Verteilung welches die Fläche misst, welche die Lorenzkurve mit der Winkelhalbierenden einschliesst|
Line 698: Line 750:
 |Standardisieren | Zentrierung und Streckung eines Merkmals zu $Z=\frac{X-\mu}{\sigma}$. Es ist dann $\mu_Z=0$ und $\sigma_Z=1$||''scale(...)''| |Standardisieren | Zentrierung und Streckung eines Merkmals zu $Z=\frac{X-\mu}{\sigma}$. Es ist dann $\mu_Z=0$ und $\sigma_Z=1$||''scale(...)''|
 |Z-Score | Siehe Standardisieren||| |Z-Score | Siehe Standardisieren|||
-<!-- 
 |Signifikanz | Prozentzahl welche den Fehler erster Art (eines Tests) beschränkt. | | | |Signifikanz | Prozentzahl welche den Fehler erster Art (eines Tests) beschränkt. | | |
 |Test| Eine statistische Entscheidungsregel, welche überprüft, ob ein Resultat zufällig ist oder nicht. | | | |Test| Eine statistische Entscheidungsregel, welche überprüft, ob ein Resultat zufällig ist oder nicht. | | |
Line 704: Line 755:
 |Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | | |Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | |
 |$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | | |$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | |
---> 
 </sortable> </sortable>
  
  • lehrkraefte/ks/ffstat2223.txt
  • Last modified: 2024/03/22 15:28
  • by Simon Knaus