Both sides previous revision
Previous revision
Next revision
|
Previous revision
Last revision
Both sides next revision
|
lehrkraefte:ks:ffstat2223 [2023/06/08 12:24] Simon Knaus |
lehrkraefte:ks:ffstat2223 [2024/03/08 13:21] Simon Knaus [Lektion 04] |
| ==== Lektion 13 ==== |
| |
| |
| === Ziele === |
| * Fragebogen ist ausgewertet |
| |
| |
| === Aufträge === |
| * Jede:r wählt sich eine Frage resp. Fragestellung, wertet diese aus und stellt sie den anderen vor. |
| * Erste Runde: Welche Fragen interessieren? |
| * Zweite Runde: Wie kann ich diese beantworten?] |
| * Bitte eure Analysen [[https://bldsg-my.sharepoint.com/:f:/g/personal/simon_knaus_ksbg_ch/Eu_V3twDFDpOkiXhUsTYhGYBN5cm2JDP0njLNYF18cJ8qQ|hier hochladen]] und die anderen ebenfalls [[https://bldsg-my.sharepoint.com/:f:/r/personal/simon_knaus_ksbg_ch/Documents/streammovies/ffstat/analysen?csf=1&web=1&e=yOgJKt|dort]] anschauen. |
| |
| Orientiert euch für die Aufträge auch am [[lehrkraefte:ks:ffstat2223#begriffe|Glossar]] unten. |
| ==== Lektion 12 ==== |
| |
| |
| === Ziele === |
| * Unser Fragenbogen ist bereit für die Datenerhebung |
| * Jede/r kann die Begriffe <<Modellwelt>> (Wahrscheinlichkeit, theoretisch) und <<Beobachtete Welt>> (Statistik, beobachtet) einordnen und umgangssprachlich erklären |
| * Jede/r kann den Begriff <<Binomialverteilung>> umgangssprachlich erklären und die theoretische Wahrscheinlichkeit berechnen, dass ein gewisses Phänomen eine bestimmte Anzahl mal auftritt |
| * Fragen zum Freifach: https://forms.office.com/e/AG8wmRmfqh |
| |
| === Autrag === |
| * Den Fragebogen einmal als Proband ausfüllen: [[https://forms.office.com/e/QwyGXe2SqW|Link]] zur Probandensicht |
| * Ggf. den Fragenbogen anpassen. [[https://forms.office.com/Pages/DesignPageV2.aspx?subpage=design&FormId=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UQlpKUTRRMFVYQUxCWEg3RlVXQlYxWkZPSiQlQCNjPTEu&Token=2f7a48a96d444f249203b49b80320843|Link zum Editieren]] des Fragenbogens. |
| * Dem Lehrer zuhören und anschliessend die Wandtafel fotografieren. |
| * Experimente (Statistik) versus Theorie (Wahrscheinlichkeit) |
| * Wirf eine Münze $n$ mal (''=WENN(ZUFALLSZAHL()<0.5;"K";"Z")'' und zähle (''ANZAHL()'' oder ''=ZÄHLEWENN()'') die Anzahl Male <<Kopf>>. Berechne auch die durchschnittliche Anzahl Kopf pro Wurf. Wie ist dieser Durchschnitt in der <<Modellwelt>> zu interpretieren? |
| * Wirf drei Münzen $n$ Mal gleichzeitig und zähle jeweils die Anzahl <<Zahl>>. Fertige ein Histogramm an. |
| * Berechne mit Excel die theoretischen Wahrscheinlichkeiten für eine Binomialverteilung (drei Münzen, $0$, $1$, $2$, $3$ mal Zahl) und vergleiche diese Werte mit dem Histogramm aus der vorigen Aufgabe |
| * Jemand hat 100 mal eine Münze geworfen. Wie gross ist die theoretische Wahrscheinlichkeit, dass man genau 67 mal Kopf beobachtet? Nimm an, dass die Münze ausgeglichen ist. |
| * Schau dir das [[https://www.youtube.com/watch?v=lgs7d5saFFc| Video]] zur <<Tea Tasting Lady>> an. Überlege dir, welche <<Fehlentscheide>> enstehen können. |
| |
| <hidden Histogramm> Die Zufallsvariable $X$ <<Anzahl Zahl>> kann die Werte $0$, $1$, $2$ und $3$ annehmen. Es geht jetz also darum (siehe Blätter), die relative Häufigkeit $h(x)=\frac{n_x}{n}$ zu berechnen und die Werte aufzuzeichnen |
| |
| </hidden> |
| <hidden Tipps R> |
| Mit R könnte das entweder mit der Funktion ''sample(...)'' gelöst werden oder mit ''ifelse(...)'' und ''runif''. Bei beiden Varianten kann die Wahrscheinlichkeit gewählt werden. |
| </hidden> |
| === Erklärungen === |
| Die Formel ''BINOM.VERT'' kann in Excel verwendet werden, um die Wahrscheinlichkeit zu berechnen bei $n$ Durchführungen eines Experiments genau $k$ mal Erfolg zu haben wobei der Erfolg mit Wahrscheinlichkeit $p$ eintritt. Man muss dann ''BINOM.VERT(k;n;p; FALSCH)'' aufrufen. ''FALSCH'' ist dabei notwendig, dass man die Wahrscheinlichkeit erhält. Würde ''WAHR'' stehen, erhielte man die Summe aller Wahrscheinlichkeiten mit Anzahl Erfolgen kleiner gleich $k$. |
| In R kann genau das gleiche mit ''dbinom(k, n, p)'' erreicht werden. |
==== Lektion 11 ==== | ==== Lektion 11 ==== |
| |
=== Aufträge === | === Aufträge === |
* Paarweise: Schaut euch [[https://forms.office.com/|Microsoft Forms]] an. ((Es existieren auch Alternativen, im Schulkontext ist das aber auf Grund der Lage bzgl. Datenschutz die Lösung der Wahl.)) Erstellt einen Fragebogen mit Testfragen, um zu verstehen, wie das Tool funktioniert. | * Paarweise: Schaut euch [[https://forms.office.com/|Microsoft Forms]] an. ((Es existieren auch Alternativen, im Schulkontext ist das aber auf Grund der Lage bzgl. Datenschutz die Lösung der Wahl.)) Erstellt einen Fragebogen mit Testfragen, um zu verstehen, wie das Tool funktioniert. |
* Paarweise: Notiert alle Analysen und Kenngrösse, welche wir im Statistikkurs bereits durchgeführt haben. Notiert diese dann an der Wandtafel. Als Stütze ggf. auch die [[lehrkraefte:ks:ffstat2223#begriffe|Begriffe]] unten. | * Paarweise: Notiert alle Analysen und Kenngrösse, welche wir im Statistikkurs bereits durchgeführt haben. Notiert diese <del>dann an der Wandtafel</del>. Als Stütze ggf. auch die [[lehrkraefte:ks:ffstat2223#begriffe|Begriffe]] unten. |
* Jede:r hält Fragen fest, die im Rahmen des <<Projekts>> erhoben werden sollen: [[https://bldsg-my.sharepoint.com/:x:/g/personal/simon_knaus_ksbg_ch/ETaGuECnRo9NkM34L-9Y8w4BcmyLagn-1v8np1F7-72HDg?e=cPIvts|Link zur Fragenerfassung]]. {{ :lehrkraefte:ks:ffstat2223:projekt.png?direct&200 |}} Für die Fragen ist auch zentral, dass ihr die Auswertung <<mitdenkt>>. Welche Auswertungen könnten gemacht werden? | * Jede:r hält Fragen fest, die im Rahmen des <<Projekts>> erhoben werden sollen: [[https://bldsg-my.sharepoint.com/:x:/g/personal/simon_knaus_ksbg_ch/ETaGuECnRo9NkM34L-9Y8w4BcmyLagn-1v8np1F7-72HDg?e=cPIvts|Link zur Fragenerfassung]]. {{ :lehrkraefte:ks:ffstat2223:projekt.png?direct&200 |}} Für die Fragen ist auch zentral, dass ihr die Auswertung <<mitdenkt>>. Welche Auswertungen könnten gemacht werden? |
* Welche Probleme könnten bei der Befragung resp. Auswertung entstehen? Bitte ebenfalls auf Wandtafel notieren. | * Welche Probleme könnten bei der Befragung resp. Auswertung entstehen? Bitte ebenfalls auf Wandtafel notieren. |
| |
| === Ressourcen === |
| * [[https://de.wikipedia.org/wiki/Big_Five_(Psychologie)|Big Five]] Fragebogen: https://www.lw.uni-leipzig.de/wilhelm-wundt-institut-fuer-psychologie/arbeitsgruppen/persoenlichkeitspsychologie-und-psychologische-diagnostik/persoenlichkeitstest |
| * |
==== Lektion 10 ==== | ==== Lektion 10 ==== |
=== Ziele === | === Ziele === |
* Kapitel 7 insb. Kapitel 7.1 | * Kapitel 7 insb. Kapitel 7.1 |
<hidden R-Code> | <hidden R-Code> |
<file code> | <code code> |
#Daten sind aus Excel in die Zwischenablage kopiert. | # cardata <- read.table(readClipboard(),header = T,sep=';') |
bmw <- read.table(file("clipboard"),sep="\t",header = T) | head(cardata) |
library(ggplot2) | unique(cardata$model) |
library(plyr) | x5 <- cardata$model == "x5" |
ggplot(bmw,aes(x=preis))+geom_histogram()+facet_wrap(~model)+xlab("Preis")+ylab("Anzahl") | x5 #ein Vektor mit TRUE and FALSE |
names(bmw) | x5preise <- cardata$preis[x5] |
ddply(bmw,.(model),summarise,median(preis)) | mean(x5preise) |
ddply(bmw,.(model),summarise,mean(preis)) | median(x5preise) |
ddply(bmw,.(model),summarise,sd(preis)) | sd(x5preise) |
ddply(bmw,.(model,zylinder),summarise,mean(preis)) | quantile(x5preise, 0.25) #25% Quantil |
#oder | quantile(x5preise, c(0.25, 0.75)) #25% Quantil und 75% Quantil |
tapply(bmw$preis,bmw$model,median) | |
tapply(bmw$preis,bmw$model,mean) | library(plyr) # Zusatzpaket 'plyr' laden (vorgänig mit install.packages('plyr') installieren) |
tapply(bmw$preis,bmw$model,sd) | head(cardata) # Erste Zeilen anzeigen |
tapply(bmw$preis,bmw$model,var) | `?`(ddply # Hilfe zu ddply |
tapply((bmw$preis,bmw$model,quantile,probs=0.25) | ) |
tapply((bmw$preis,bmw$model,quantile,probs=0.75) | ddply(cardata, .(model), summarise, preis = mean(preis)) # Mittelwert des Preises nach Modell anzeigen |
tapply((bmw$preis,bmw$model,quantile,probs=0.75)-tapply((bmw$preis,bmw$model,quantile,probs=0.25) | ddply(cardata, .(model), summarise, preis = median(preis)) # Median des Preises nach Modell anzeigen |
#gibt das gleiche wie | ddply(cardata, .(model, zylinder), summarise, preis = mean(preis)) # Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen |
tapply(bmw$preis,bmw$model,IQR) | </code> |
mean(bmw$preis[bmw$model=="x1"]) | |
</file> | |
</hidden> | </hidden> |
| |
[[https://web.microsoftstream.com/video/f3892b11-1d93-48d7-b59a-e9e8b0a890ee|Einführung Pivot]] | [[https://web.microsoftstream.com/video/f3892b11-1d93-48d7-b59a-e9e8b0a890ee|Einführung Pivot]] |
<code R ddplystattpivot.R> | <code R ddplystattpivot.R> |
library(plyr) #Zusatzpaket 'plyr' laden (vorgänig mit install.packages("plyr") installieren) | setwd("Pfad zum Arbeitsverzeichnis angeben") |
head(cardata) #Erste Zeilen anzeigen | cardata <- read.csv2("bmw_data.csv") |
?ddply #Hilfe zu ddply | |
ddply(cardata,.(model),summarise,preis=mean(preis)) #Mittelwert des Preises nach Modell anzeigen | # install.packages("plyr") # installiert Paket |
ddply(cardata,.(model),summarise,preis=median(preis)) #Median des Preises nach Modell anzeigen | |
ddply(cardata,.(model,zylinder),summarise,preis=mean(preis)) #Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen | library(plyr) |
| # Daten laden |
| cardata <- read.csv2("bmw_data.csv") |
| library(plyr) # Zusatzpaket 'plyr' laden (vorgänig mit install.packages("plyr") installieren) |
| head(cardata) # Erste Zeilen anzeigen |
| ?ddply # Hilfe zu ddply |
| ddply(cardata, .(model), summarise, preis = mean(preis)) # Mittelwert des Preises nach Modell anzeigen |
| ddply(cardata, .(model), summarise, preis = median(preis)) # Median des Preises nach Modell anzeigen |
| ddply(cardata, .(model, zylinder), summarise, preis = mean(preis)) # Mittelwert des Preises nach Modell und Anzahl Zylinder anzeigen |
</code> | </code> |
| |
|Standardisieren | Zentrierung und Streckung eines Merkmals zu $Z=\frac{X-\mu}{\sigma}$. Es ist dann $\mu_Z=0$ und $\sigma_Z=1$||''scale(...)''| | |Standardisieren | Zentrierung und Streckung eines Merkmals zu $Z=\frac{X-\mu}{\sigma}$. Es ist dann $\mu_Z=0$ und $\sigma_Z=1$||''scale(...)''| |
|Z-Score | Siehe Standardisieren||| | |Z-Score | Siehe Standardisieren||| |
<!-- | |
|Signifikanz | Prozentzahl welche den Fehler erster Art (eines Tests) beschränkt. | | | | |Signifikanz | Prozentzahl welche den Fehler erster Art (eines Tests) beschränkt. | | | |
|Test| Eine statistische Entscheidungsregel, welche überprüft, ob ein Resultat zufällig ist oder nicht. | | | | |Test| Eine statistische Entscheidungsregel, welche überprüft, ob ein Resultat zufällig ist oder nicht. | | | |
|Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | | | |Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | | |
|$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | | | |$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | | |
--> | |
</sortable> | </sortable> |
| |