lehrkraefte:ks:ffstat2223

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
lehrkraefte:ks:ffstat2223 [2023/06/08 11:35]
Simon Knaus
lehrkraefte:ks:ffstat2223 [2024/03/22 15:28] (current)
Simon Knaus
Line 1: Line 1:
 +==== Lektion 13 ====
 +
 +
 +=== Ziele === 
 +  * Fragebogen ist ausgewertet
 +
 +
 +=== Aufträge ===
 +  * Jede:r wählt sich eine Frage resp. Fragestellung, wertet diese aus und stellt sie den anderen vor.
 +   * Erste Runde: Welche Fragen interessieren?
 +   * Zweite Runde: Wie kann ich diese beantworten?  
 +   * Bitte eure Analysen [[https://bldsg-my.sharepoint.com/:f:/g/personal/simon_knaus_ksbg_ch/Eu_V3twDFDpOkiXhUsTYhGYBN5cm2JDP0njLNYF18cJ8qQ|hier hochladen]] und die anderen ebenfalls [[https://bldsg-my.sharepoint.com/:f:/r/personal/simon_knaus_ksbg_ch/Documents/streammovies/ffstat/analysen?csf=1&web=1&e=yOgJKt|dort]] anschauen.
 +
 +Orientiert euch für die Aufträge auch am [[lehrkraefte:ks:ffstat2223#begriffe|Glossar]] unten.   
 +==== Lektion 12 ====
 +
 +
 +=== Ziele === 
 +  * Unser Fragenbogen ist bereit für die Datenerhebung
 +  * Jede/r kann die Begriffe <<Modellwelt>> (Wahrscheinlichkeit, theoretisch) und <<Beobachtete Welt>> (Statistik, beobachtet) einordnen und umgangssprachlich erklären
 +  * Jede/r kann den Begriff <<Binomialverteilung>> umgangssprachlich erklären und die theoretische Wahrscheinlichkeit berechnen, dass ein gewisses Phänomen eine bestimmte Anzahl mal auftritt
 +  * Fragen zum Freifach: https://forms.office.com/e/AG8wmRmfqh
 +
 +=== Autrag ===
 +  * Den Fragebogen einmal als Proband ausfüllen: [[https://forms.office.com/e/QwyGXe2SqW|Link]] zur Probandensicht
 +  * Ggf. den Fragenbogen anpassen. [[https://forms.office.com/Pages/DesignPageV2.aspx?subpage=design&FormId=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UQlpKUTRRMFVYQUxCWEg3RlVXQlYxWkZPSiQlQCNjPTEu&Token=2f7a48a96d444f249203b49b80320843|Link zum Editieren]] des Fragenbogens.
 +  * Dem Lehrer zuhören und anschliessend die Wandtafel fotografieren.
 +  * Experimente (Statistik) versus Theorie (Wahrscheinlichkeit)
 +    * Wirf eine Münze $n$ mal (''=WENN(ZUFALLSZAHL()<0.5;"K";"Z")'' und zähle (''ANZAHL()'' oder ''=ZÄHLEWENN()'') die Anzahl Male <<Kopf>>. Berechne auch die durchschnittliche Anzahl Kopf pro Wurf. Wie ist dieser Durchschnitt in der <<Modellwelt>> zu interpretieren?
 +    * Wirf drei Münzen $n$ Mal gleichzeitig und zähle jeweils die Anzahl <<Zahl>>. Fertige ein Histogramm an. 
 +    * Berechne mit Excel die theoretischen Wahrscheinlichkeiten für eine Binomialverteilung (drei Münzen, $0$, $1$, $2$, $3$ mal Zahl) und vergleiche diese Werte mit dem Histogramm aus der vorigen Aufgabe
 +    * Jemand hat 100 mal eine Münze geworfen. Wie gross ist die theoretische Wahrscheinlichkeit, dass man genau 67 mal Kopf beobachtet? Nimm an, dass die Münze ausgeglichen ist.
 +    * Schau dir  das [[https://www.youtube.com/watch?v=lgs7d5saFFc| Video]] zur <<Tea Tasting Lady>> an. Überlege dir, welche <<Fehlentscheide>> enstehen können.
 + 
 + <hidden Histogramm> Die Zufallsvariable $X$ <<Anzahl Zahl>> kann die Werte $0$, $1$, $2$ und $3$ annehmen. Es geht jetz also darum (siehe Blätter), die relative Häufigkeit $h(x)=\frac{n_x}{n}$ zu berechnen und die Werte aufzuzeichnen
 +
 +</hidden>
 +<hidden Tipps R>
 +Mit R könnte das entweder mit der Funktion ''sample(...)'' gelöst werden oder mit ''ifelse(...)'' und ''runif''. Bei beiden Varianten kann die Wahrscheinlichkeit gewählt werden.
 +</hidden>
 +=== Erklärungen ===
 +Die Formel ''BINOM.VERT'' kann in Excel verwendet werden, um die Wahrscheinlichkeit zu berechnen bei $n$ Durchführungen eines Experiments genau $k$ mal Erfolg zu haben wobei der Erfolg mit Wahrscheinlichkeit $p$ eintritt. Man muss dann ''BINOM.VERT(k;n;p; FALSCH)'' aufrufen. ''FALSCH'' ist dabei notwendig, dass man die Wahrscheinlichkeit erhält. Würde ''WAHR'' stehen, erhielte man die Summe aller Wahrscheinlichkeiten mit Anzahl Erfolgen kleiner gleich $k$.
 +In R kann genau das gleiche mit ''dbinom(k, n, p)'' erreicht werden.
 ==== Lektion 11 ==== ==== Lektion 11 ====
  
Line 5: Line 48:
  
 === Aufträge === === Aufträge ===
-  * Paarweise: Schaut euch [[https://forms.office.com/|Microsoft Forms]] an. ((Es existieren auch Alternativen, im Schulkontext ist das aber auf Grund der Lage bzgl. Datenschutz die Lösung der Wahl.)) Erstellt einen Fragebogen mit Testfrage, um zu verstehen, wie das Tool funktioniert. +  * Paarweise: Schaut euch [[https://forms.office.com/|Microsoft Forms]] an. ((Es existieren auch Alternativen, im Schulkontext ist das aber auf Grund der Lage bzgl. Datenschutz die Lösung der Wahl.)) Erstellt einen Fragebogen mit Testfragen, um zu verstehen, wie das Tool funktioniert. 
-  * Paarweise: Notiert alle Analysen und Kenngrösse, welche wir im Statistikkurs bereits durchgeführt haben. Notiert diese dann an der Wandtafel. Als Stütze ggf. auch die [[lehrkraefte:ks:ffstat2223#begriffe|Begriffe]] unten. +  * Paarweise: Notiert alle Analysen und Kenngrösse, welche wir im Statistikkurs bereits durchgeführt haben. Notiert diese <del>dann an der Wandtafel</del>. Als Stütze ggf. auch die [[lehrkraefte:ks:ffstat2223#begriffe|Begriffe]] unten. 
-  * Jede:r hält Fragen fest, die im Rahmen des <<Projekts>> erhoben werden sollen: [[https://bldsg-my.sharepoint.com/:x:/g/personal/simon_knaus_ksbg_ch/ETaGuECnRo9NkM34L-9Y8w4BcmyLagn-1v8np1F7-72HDg?e=cPIvts|Link zur Fragenerfassung]]. {{ :lehrkraefte:ks:ffstat2223:projekt.png?direct&200 |}}Für die Fragen ist auch zentral, dass ihr die Auswertung <<mitdenkt>>. Welche Auswertungen könnten gemacht werden?+  * Jede:r hält Fragen fest, die im Rahmen des <<Projekts>> erhoben werden sollen: [[https://bldsg-my.sharepoint.com/:x:/g/personal/simon_knaus_ksbg_ch/ETaGuECnRo9NkM34L-9Y8w4BcmyLagn-1v8np1F7-72HDg?e=cPIvts|Link zur Fragenerfassung]]. {{ :lehrkraefte:ks:ffstat2223:projekt.png?direct&200 |}} Für die Fragen ist auch zentral, dass ihr die Auswertung <<mitdenkt>>. Welche Auswertungen könnten gemacht werden?
   * Welche Probleme könnten bei der Befragung resp. Auswertung entstehen? Bitte ebenfalls auf Wandtafel notieren.   * Welche Probleme könnten bei der Befragung resp. Auswertung entstehen? Bitte ebenfalls auf Wandtafel notieren.
 +
 +=== Ressourcen === 
 +  * [[https://de.wikipedia.org/wiki/Big_Five_(Psychologie)|Big Five]] Fragebogen: https://www.lw.uni-leipzig.de/wilhelm-wundt-institut-fuer-psychologie/arbeitsgruppen/persoenlichkeitspsychologie-und-psychologische-diagnostik/persoenlichkeitstest
 +  * 
 ==== Lektion 10 ==== ==== Lektion 10 ====
 === Ziele === === Ziele ===
Line 468: Line 515:
 === Anwendungen Boxplot === === Anwendungen Boxplot ===
 Löhne in der Stadt Zürich Löhne in der Stadt Zürich
-      *  {{https://www.stadt-zuerich.ch/content/dam/stzh/prd/Deutsch/Statistik/Themen/Wirtschaft/2015-11-12_Statistik-um-12_Loehne-in-der-Stadt-Zuerich.pdf|Lohnreport der Stadt Zürich}} Herunterladen. +      *  {{lehrkraefte:ks:2015-11-12_statistik-um-12_loehne-in-der-stadt-zuerich1.pdf|Lohnreport der Stadt Zürich}} Herunterladen. 
       * Insb. Seiten 13 bis 15: Überrascht diese Verteilung?       * Insb. Seiten 13 bis 15: Überrascht diese Verteilung?
       * Welche Grafiken / Methoden sind aus dem Freifach bekannt?       * Welche Grafiken / Methoden sind aus dem Freifach bekannt?
-      * Gibt es irgeneine Graphik im Lohnreport, welche nicht klar ist?+      * Gibt es irgendeine Graphik im Lohnreport, welche nicht klar ist?
       * Wie würde der Lohnreport der Stadt St. Gallen aussehen?       * Wie würde der Lohnreport der Stadt St. Gallen aussehen?
 ==== Lektion 04 ==== ==== Lektion 04 ====
Line 523: Line 570:
   * Kapitel 7 insb. Kapitel 7.1   * Kapitel 7 insb. Kapitel 7.1
 <hidden R-Code> <hidden R-Code>
-<file code> +<code code> 
-#Daten sind aus Excel in die Zwischenablage kopiert. +cardata <- read.table(readClipboard(),header T,sep=';'
-bmw <- read.table(file("clipboard"),sep="\t",header T+head(cardata
-library(ggplot2+unique(cardata$model
-library(plyr+x5 <- cardata$model == "x5" 
-ggplot(bmw,aes(x=preis))+geom_histogram()+facet_wrap(~model)+xlab("Preis")+ylab("Anzahl"+x5  #ein Vektor mit TRUE and FALSE 
-names(bmw+x5preise <- cardata$preis[x5] 
-ddply(bmw,.(model),summarise,median(preis)) +mean(x5preise) 
-ddply(bmw,.(model),summarise,mean(preis)) +median(x5preise) 
-ddply(bmw,.(model),summarise,sd(preis)) +sd(x5preise
-ddply(bmw,.(model,zylinder),summarise,mean(preis)) +quantile(x5preise, 0.25#25% Quantil 
-#oder +quantile(x5preisec(0.250.75)) #25% Quantil und 75% Quantil 
-tapply(bmw$preis,bmw$model,median+ 
-tapply(bmw$preis,bmw$model,mean) +library(plyr)  # Zusatzpaket 'plyr' laden (vorgänig mit install.packages('plyr'installieren) 
-tapply(bmw$preis,bmw$model,sd+head(cardata # Erste Zeilen anzeigen 
-tapply(bmw$preis,bmw$model,var) +`?`(ddply  # Hilfe zu ddply 
-tapply((bmw$preis,bmw$model,quantile,probs=0.25) +
-tapply((bmw$preis,bmw$model,quantile,probs=0.75) +ddply(cardata, .(model), summarise, preis = mean(preis))  # Mittelwert des Preises nach Modell anzeigen 
-tapply((bmw$preis,bmw$model,quantile,probs=0.75)-tapply((bmw$preis,bmw$model,quantile,probs=0.25) +ddply(cardata, .(model), summarise, preis median(preis))  # Median des Preises nach Modell anzeigen 
-#gibt das gleiche wie  +ddply(cardata, .(model, zylinder), summarise, preis = mean(preis))  # Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen 
-tapply(bmw$preis,bmw$model,IQR) +</code>
-mean(bmw$preis[bmw$model=="x1"]+
-</file>+
 </hidden> </hidden>
  
Line 615: Line 660:
 [[https://web.microsoftstream.com/video/f3892b11-1d93-48d7-b59a-e9e8b0a890ee|Einführung Pivot]] [[https://web.microsoftstream.com/video/f3892b11-1d93-48d7-b59a-e9e8b0a890ee|Einführung Pivot]]
 <code R  ddplystattpivot.R> <code R  ddplystattpivot.R>
-library(plyr) #Zusatzpaket 'plyr' laden (vorgänig mit install.packages("plyr") installieren) +setwd("Pfad zum Arbeitsverzeichnis angeben"
-head(cardata) #Erste Zeilen anzeigen +cardata <- read.csv2("bmw_data.csv"
-?ddply #Hilfe zu ddply + 
-ddply(cardata,.(model),summarise,preis=mean(preis)) #Mittelwert des Preises nach Modell anzeigen +# install.packages("plyr") # installiert Paket 
-ddply(cardata,.(model),summarise,preis=median(preis)) #Median des Preises nach Modell anzeigen + 
-ddply(cardata,.(model,zylinder),summarise,preis=mean(preis)) #Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen+library(plyr) 
 +# Daten laden 
 +cardata <- read.csv2("bmw_data.csv"
 +library(plyr) # Zusatzpaket 'plyr' laden (vorgänig mit install.packages("plyr") installieren) 
 +head(cardata) # Erste Zeilen anzeigen 
 +?ddply # Hilfe zu ddply 
 +ddply(cardata, .(model), summarise, preis = mean(preis)) # Mittelwert des Preises nach Modell anzeigen 
 +ddply(cardata, .(model), summarise, preis = median(preis)) # Median des Preises nach Modell anzeigen 
 +ddply(cardata, .(model, zylinder), summarise, preis = mean(preis)) # Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen 
 </code> </code>
  
Line 682: Line 736:
 |$\alpha$-Quantil| Zum Prozentrang $\alpha$ gehöriger Wert | ''QUANTIL.INKL()'' | ''quantile(,,type=2)''| |$\alpha$-Quantil| Zum Prozentrang $\alpha$ gehöriger Wert | ''QUANTIL.INKL()'' | ''quantile(,,type=2)''|
 |IQA | Interquartilsabstand. Differenz des 1. und 3. Quartils|| ''QUANTIL.INKL(...;.75)-QUANTIL.INKL(...;.25)''| |IQA | Interquartilsabstand. Differenz des 1. und 3. Quartils|| ''QUANTIL.INKL(...;.75)-QUANTIL.INKL(...;.25)''|
- +|Boxplot |Illustration der Verteilung mit Quartilen | |''boxplot()''|
-|Boxplot|Illustration der Verteilung mit Quartilen | |''boxplot()''|+
 |Outlier | Ausreisser. Eine mögliche Definition für Outlier, sind Werte, die ausserhalb der Whiskers beim Boxplot sind | |Outlier | Ausreisser. Eine mögliche Definition für Outlier, sind Werte, die ausserhalb der Whiskers beim Boxplot sind |
- 
 |Lorenzkurve | Mass zur Konzentration einer Verteilung. Es wir dabei die relative kumulierte Anzahl gegen die relative kumulierte Summe des Merkmals gezeichnet| |Lorenzkurve | Mass zur Konzentration einer Verteilung. Es wir dabei die relative kumulierte Anzahl gegen die relative kumulierte Summe des Merkmals gezeichnet|
 |Gini-Koeffizient| Mass der Konzentration einer Verteilung welches die Fläche misst, welche die Lorenzkurve mit der Winkelhalbierenden einschliesst| |Gini-Koeffizient| Mass der Konzentration einer Verteilung welches die Fläche misst, welche die Lorenzkurve mit der Winkelhalbierenden einschliesst|
Line 698: Line 750:
 |Standardisieren | Zentrierung und Streckung eines Merkmals zu $Z=\frac{X-\mu}{\sigma}$. Es ist dann $\mu_Z=0$ und $\sigma_Z=1$||''scale(...)''| |Standardisieren | Zentrierung und Streckung eines Merkmals zu $Z=\frac{X-\mu}{\sigma}$. Es ist dann $\mu_Z=0$ und $\sigma_Z=1$||''scale(...)''|
 |Z-Score | Siehe Standardisieren||| |Z-Score | Siehe Standardisieren|||
-<!-- 
 |Signifikanz | Prozentzahl welche den Fehler erster Art (eines Tests) beschränkt. | | | |Signifikanz | Prozentzahl welche den Fehler erster Art (eines Tests) beschränkt. | | |
 |Test| Eine statistische Entscheidungsregel, welche überprüft, ob ein Resultat zufällig ist oder nicht. | | | |Test| Eine statistische Entscheidungsregel, welche überprüft, ob ein Resultat zufällig ist oder nicht. | | |
Line 704: Line 755:
 |Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | | |Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | |
 |$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | | |$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | |
---> 
 </sortable> </sortable>
  
  • lehrkraefte/ks/ffstat2223.1686216937.txt.gz
  • Last modified: 2023/06/08 11:35
  • by Simon Knaus