Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
lehrkraefte:ks:ffstat2122:start [2022/06/03 14:08] Simon Knaus |
lehrkraefte:ks:ffstat2122:start [2023/06/01 09:40] Simon Knaus |
||
---|---|---|---|
Line 1: | Line 1: | ||
==== Freifach Statistik ==== | ==== Freifach Statistik ==== | ||
+ | lekti | ||
+ | |||
=== Links === | === Links === | ||
Line 5: | Line 7: | ||
* [[https:// | * [[https:// | ||
* [[lehrkraefte: | * [[lehrkraefte: | ||
+ | |||
+ | ==== Lektion 14 ==== | ||
+ | === Ziele === | ||
+ | * Auswertung Fragebogen | ||
+ | * Besprechung Freifach Statistik | ||
+ | |||
+ | === Aufträge === | ||
+ | * [[https:// | ||
+ | * Analysen auswählen | ||
+ | * Welche Analysen sind in welcher Variabel-Konstellation möglich? (Nominal, ordinale, kardinale Variablen) | ||
+ | * Analysen durchführen und Resultate (Grafiken oder Tabellen) in einem Dokument festhalten | ||
+ | * Ggf. Daten recodieren (s.u.) | ||
+ | |||
+ | === Theorie === | ||
+ | |||
+ | Beim << | ||
+ | In Excel geht das am einfachsten mit suchen und ersetzen (Achtung bei der Reihenfolge: | ||
+ | * '' | ||
+ | * Mit Index-Vektoren wie z.B. in [[http:// | ||
+ | * Mit '' | ||
+ | === Daten einlesen und recodieren in R === | ||
+ | |||
+ | Idealerweise werden die Zeilenspaltentitel bereits in Excel angepasst. Damit hat man kurze Variabelnamen und man kann dann mit '' | ||
+ | |||
+ | Sind die Daten eingelesen, kann mit | ||
+ | <code python> | ||
+ | gluecksdata <- read.table(file(' | ||
+ | # Recodieren | ||
+ | # Annahme die 8. Spalte hat neu den Titel ' | ||
+ | gluecksdata$allinall <- gsub(" | ||
+ | </ | ||
+ | |||
+ | <hidden Mögliche Lösung> | ||
+ | < | ||
+ | data <- read.table(file(" | ||
+ | head(data) | ||
+ | library(ggplot2) | ||
+ | names(data) | ||
+ | # | ||
+ | data$overall <- with(data, | ||
+ | #glück vs. aussehen | ||
+ | ggplot(data, | ||
+ | #glück vs. gesundheit | ||
+ | ggplot(data, | ||
+ | #glück vs. sleep | ||
+ | ggplot(data, | ||
+ | ggplot(subset(data, | ||
+ | |||
+ | with(subset(data, | ||
+ | ggplot(data, | ||
+ | ggplot(subset(data, | ||
+ | ggplot(data, | ||
+ | ggplot(subset(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | library(corrplot) | ||
+ | relvar <- sapply(data, | ||
+ | corrplot(cor(subset(data[, | ||
+ | ggplot(da) | ||
+ | |||
+ | |||
+ | </ | ||
+ | </ | ||
+ | |||
+ | ==== Lektion 13 ==== | ||
+ | |||
+ | |||
+ | === Ziele === | ||
+ | * Unser Fragenbogen ist bereit für die Datenerhebung | ||
+ | * Jede/r kann die Begriffe << | ||
+ | * Jede/r kann den Begriff << | ||
+ | * Optional: Jede/r kann den Begriff << | ||
+ | |||
+ | === Autrag === | ||
+ | * Den Fragebogen einmal als Proband ausfüllen: [[https:// | ||
+ | * Ggf. den Fragenbogen anpassen. [[https:// | ||
+ | * Dem Lehrer zuhören und anschliessend die Wandtafel fotografieren. | ||
+ | * Experimente (Statistik) versus Theorie (Wahrscheinlichkeit) | ||
+ | * Wirf eine Münze $n$ mal ('' | ||
+ | * Wirf drei Münzen $n$ Mal gleichzeitig und zähle jeweils die Anzahl << | ||
+ | * Berechne mit Excel die theoretischen Wahrscheinlichkeiten für eine Binomialverteilung (drei Münzen, $0$, $1$, $2$, $3$ mal Zahl) und vergleiche diese Werte mit dem Histogramm aus der vorigen Aufgabe | ||
+ | * Jemand hat 100 mal eine Münze geworfen. Wie gross ist die theoretische Wahrscheinlichkeit, | ||
+ | * Schau dir das das [[https:// | ||
+ | |||
+ | < | ||
+ | |||
+ | </ | ||
+ | <hidden Tipps R> | ||
+ | Mit R könnte das entweder mit der Funktion '' | ||
+ | </ | ||
+ | === Erklärungen === | ||
+ | Die Formel '' | ||
+ | In R kann genau das gleiche mit '' | ||
==== Lektion 12 ==== | ==== Lektion 12 ==== | ||
=== Ziel === | === Ziel === | ||
- | * Umfrage für unser Projekt steht und ist nach Möglichkeit bereits | + | * Umfrage für unser Projekt steht und ist nach Möglichkeit bereits |
=== Aufträge === | === Aufträge === | ||
* Jede/r hält Fragen fest, die zusätzlich erhoben werden sollen, um unser << | * Jede/r hält Fragen fest, die zusätzlich erhoben werden sollen, um unser << | ||
- | * Eigene Fragen hier [[https:// | + | * Eigene Fragen hier [[https:// |
* [[https:// | * [[https:// | ||
* Welche Auswertungen können mit diesen Fragen beantwortet werden? | * Welche Auswertungen können mit diesen Fragen beantwortet werden? | ||
Line 22: | Line 123: | ||
==== Lektion 11 ==== | ==== Lektion 11 ==== | ||
=== Ziele === | === Ziele === | ||
- | * Jede/r kann die $Z$-transformierte | + | * Jede/r kann die $Z$-Transformierte |
* Jede/r kann auf Grund von Histogrammen der $Z$-transformierten Merkmale entscheiden, | * Jede/r kann auf Grund von Histogrammen der $Z$-transformierten Merkmale entscheiden, | ||
* Optional: Jede/r kann die Wahrscheinlichkeit berechnen, dass ein Merkmal innerhalb / ausserhalb eines Intervalls zu liegen kommt. | * Optional: Jede/r kann die Wahrscheinlichkeit berechnen, dass ein Merkmal innerhalb / ausserhalb eines Intervalls zu liegen kommt. | ||
Line 419: | Line 520: | ||
* Die BMW Boxplots den BMW Histogrammen zuordnen | * Die BMW Boxplots den BMW Histogrammen zuordnen | ||
* Die BMW Mittelwerte, | * Die BMW Mittelwerte, | ||
- | * Ein Beispiel konstruieren, | + | |
- | * Eine erhobene Grösse | + | * Abschnitt unten zu " |
+ | | ||
+ | * Eine erhobene Grösse | ||
=== Boxplot === | === Boxplot === | ||
Line 1239: | Line 1342: | ||
|Bestimmtheismass|Quadrat der Korrelation, | |Bestimmtheismass|Quadrat der Korrelation, | ||
|Erklärende Variable | Variable (z.B. Kilometer) welche die abhängige Variable (z.B. Preis) in einer Regression erklären soll ||| | |Erklärende Variable | Variable (z.B. Kilometer) welche die abhängige Variable (z.B. Preis) in einer Regression erklären soll ||| | ||
- | |Regression | Bestimmung einer linearen Funktion, welche den Zusammenhang zwischen erklärender und abhängier Variable herstellt|Daten -> analyse|'' | + | |Regression | Bestimmung einer linearen Funktion, welche den Zusammenhang zwischen erklärender und abhängier Variable herstellt|Daten -> Analyse|'' |
|Koeffizienten | Abschnitt und Steigung der linearen Funktion einer Regression ||| | |Koeffizienten | Abschnitt und Steigung der linearen Funktion einer Regression ||| | ||
|Dummy-Variable | Variable mit den Ausprägungen $0$ und $1$ um eine nominale Variable in einer Regression zu verwenden ||| | |Dummy-Variable | Variable mit den Ausprägungen $0$ und $1$ um eine nominale Variable in einer Regression zu verwenden ||| | ||
+ | |Normalverteilung | Auch Gaussverteilung. Häufige Verteilung von Merkmalen. Das Histogamm gleich dabei einer Glockenkurve||| | ||
+ | |Standardisieren | Zentrierung und Streckung eines Merkmals zu $Z=\frac{X-\mu}{\sigma}$. Es ist dann $\mu_Z=0$ und $\sigma_Z=1$||'' | ||
+ | |Z-Score | Siehe Standardisieren||| | ||
< | < | ||
|Test| Eine statistische Entscheidungsregel, | |Test| Eine statistische Entscheidungsregel, | ||
Line 1247: | Line 1353: | ||
|Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | | | |Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | | | ||
|$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | | | |$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | | | ||
- | |Normalverteilung | Auch Gaussverteilung. Häufige Verteilung von Merkmalen. Das Histogamm gleich dabei einer Glockenkurve||| | + | --> |
- | |Standardisieren | Zentrierung und Streckung eines Merkmals zu $Z=\frac{X-\mu}{\sigma}$. Es ist dann $\mu_Z=0$ und $\sigma_Z=1$|||--> | + | |
</ | </ | ||