Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
lehrkraefte:ks:ffstat2122:start [2022/05/20 16:56] Simon Knaus |
lehrkraefte:ks:ffstat2122:start [2022/06/24 17:10] Simon Knaus |
||
---|---|---|---|
Line 1: | Line 1: | ||
==== Freifach Statistik ==== | ==== Freifach Statistik ==== | ||
+ | |||
+ | |||
=== Links === | === Links === | ||
Line 6: | Line 8: | ||
* [[lehrkraefte: | * [[lehrkraefte: | ||
+ | ==== Lektion 14 ==== | ||
+ | === Ziele === | ||
+ | * Auswertung Fragebogen | ||
+ | * Besprechung Freifach Statistik | ||
+ | |||
+ | === Aufträge === | ||
+ | * [[https:// | ||
+ | * Analysen auswählen | ||
+ | * Welche Analysen sind in welcher Variabel-Konstellation möglich? (Nominal, ordinale, kardinale Variablen) | ||
+ | * Analysen durchführen und Resultate (Grafiken oder Tabellen) in einem Dokument festhalten | ||
+ | * Ggf. Daten recodieren (s.u.) | ||
+ | |||
+ | === Theorie === | ||
+ | |||
+ | Beim << | ||
+ | In Excel geht das am einfachsten mit suchen und ersetzen (Achtung bei der Reihenfolge: | ||
+ | * '' | ||
+ | * Mit Index-Vektoren wie z.B. in [[http:// | ||
+ | * Mit '' | ||
+ | === Daten einlesen und recodieren in R === | ||
+ | |||
+ | Idealerweise werden die Zeilenspaltentitel bereits in Excel angepasst. Damit hat man kurze Variabelnamen und man kann dann mit '' | ||
+ | |||
+ | Sind die Daten eingelesen, kann mit | ||
+ | <code python> | ||
+ | gluecksdata <- read.table(file(' | ||
+ | # Recodieren | ||
+ | # Annahme die 8. Spalte hat neu den Titel ' | ||
+ | gluecksdata$allinall <- gsub(" | ||
+ | </ | ||
+ | |||
+ | <hidden Mögliche Lösung> | ||
+ | < | ||
+ | data <- read.table(file(" | ||
+ | head(data) | ||
+ | library(ggplot2) | ||
+ | names(data) | ||
+ | # | ||
+ | data$overall <- with(data, | ||
+ | #glück vs. aussehen | ||
+ | ggplot(data, | ||
+ | #glück vs. gesundheit | ||
+ | ggplot(data, | ||
+ | #glück vs. sleep | ||
+ | ggplot(data, | ||
+ | ggplot(subset(data, | ||
+ | |||
+ | with(subset(data, | ||
+ | ggplot(data, | ||
+ | ggplot(subset(data, | ||
+ | ggplot(data, | ||
+ | ggplot(subset(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | ggplot(data, | ||
+ | library(corrplot) | ||
+ | relvar <- sapply(data, | ||
+ | corrplot(cor(subset(data[, | ||
+ | ggplot(da) | ||
+ | |||
+ | |||
+ | </ | ||
+ | </ | ||
+ | |||
+ | ==== Lektion 13 ==== | ||
+ | |||
+ | |||
+ | === Ziele === | ||
+ | * Unser Fragenbogen ist bereit für die Datenerhebung | ||
+ | * Jede/r kann die Begriffe << | ||
+ | * Jede/r kann den Begriff << | ||
+ | * Optional: Jede/r kann den Begriff << | ||
+ | |||
+ | === Autrag === | ||
+ | * Den Fragebogen einmal als Proband ausfüllen: [[https:// | ||
+ | * Ggf. den Fragenbogen anpassen. [[https:// | ||
+ | * Dem Lehrer zuhören und anschliessend die Wandtafel fotografieren. | ||
+ | * Experimente (Statistik) versus Theorie (Wahrscheinlichkeit) | ||
+ | * Wirf eine Münze $n$ mal ('' | ||
+ | * Wirf drei Münzen $n$ Mal gleichzeitig und zähle jeweils die Anzahl << | ||
+ | * Berechne mit Excel die theoretischen Wahrscheinlichkeiten für eine Binomialverteilung (drei Münzen, $0$, $1$, $2$, $3$ mal Zahl) und vergleiche diese Werte mit dem Histogramm aus der vorigen Aufgabe | ||
+ | * Jemand hat 100 mal eine Münze geworfen. Wie gross ist die theoretische Wahrscheinlichkeit, | ||
+ | * Schau dir das das [[https:// | ||
+ | |||
+ | < | ||
+ | |||
+ | </ | ||
+ | <hidden Tipps R> | ||
+ | Mit R könnte das entweder mit der Funktion '' | ||
+ | </ | ||
+ | === Erklärungen === | ||
+ | Die Formel '' | ||
+ | In R kann genau das gleiche mit '' | ||
+ | ==== Lektion 12 ==== | ||
+ | === Ziel === | ||
+ | * Umfrage für unser Projekt steht und ist nach Möglichkeit bereits getestet. | ||
+ | |||
+ | === Aufträge === | ||
+ | * Jede/r hält Fragen fest, die zusätzlich erhoben werden sollen, um unser << | ||
+ | * Eigene Fragen hier [[https:// | ||
+ | * [[https:// | ||
+ | * Welche Auswertungen können mit diesen Fragen beantwortet werden? | ||
+ | * Welche statistischen Kenngrössen braucht man dazu? | ||
+ | * Welche Analysen sind notwendig? | ||
+ | * Erste Analyse bereits mit Dummy-Daten durchführen um festzustellen, | ||
+ | * Plan wie man zu Daten kommt erarbeiten | ||
+ | * Online | ||
+ | * Offline, QR, etc. | ||
==== Lektion 11 ==== | ==== Lektion 11 ==== | ||
=== Ziele === | === Ziele === | ||
Line 1225: | Line 1340: | ||
|Bestimmtheismass|Quadrat der Korrelation, | |Bestimmtheismass|Quadrat der Korrelation, | ||
|Erklärende Variable | Variable (z.B. Kilometer) welche die abhängige Variable (z.B. Preis) in einer Regression erklären soll ||| | |Erklärende Variable | Variable (z.B. Kilometer) welche die abhängige Variable (z.B. Preis) in einer Regression erklären soll ||| | ||
- | |Regression | Bestimmung einer linearen Funktion, welche den Zusammenhang zwischen erklärender und abhängier Variable herstellt|Daten -> analyse|'' | + | |Regression | Bestimmung einer linearen Funktion, welche den Zusammenhang zwischen erklärender und abhängier Variable herstellt|Daten -> Analyse|'' |
|Koeffizienten | Abschnitt und Steigung der linearen Funktion einer Regression ||| | |Koeffizienten | Abschnitt und Steigung der linearen Funktion einer Regression ||| | ||
|Dummy-Variable | Variable mit den Ausprägungen $0$ und $1$ um eine nominale Variable in einer Regression zu verwenden ||| | |Dummy-Variable | Variable mit den Ausprägungen $0$ und $1$ um eine nominale Variable in einer Regression zu verwenden ||| | ||
+ | |Normalverteilung | Auch Gaussverteilung. Häufige Verteilung von Merkmalen. Das Histogamm gleich dabei einer Glockenkurve||| | ||
+ | |Standardisieren | Zentrierung und Streckung eines Merkmals zu $Z=\frac{X-\mu}{\sigma}$. Es ist dann $\mu_Z=0$ und $\sigma_Z=1$||'' | ||
+ | |Z-Score | Siehe Standardisieren||| | ||
< | < | ||
|Test| Eine statistische Entscheidungsregel, | |Test| Eine statistische Entscheidungsregel, | ||
Line 1233: | Line 1351: | ||
|Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | | | |Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | | | ||
|$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | | | |$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | | | ||
- | |Normalverteilung | Auch Gaussverteilung. Häufige Verteilung von Merkmalen. Das Histogamm gleich dabei einer Glockenkurve||| | + | --> |
- | |Standardisieren | Zentrierung und Streckung eines Merkmals zu $Z=\frac{X-\mu}{\sigma}$. Es ist dann $\mu_Z=0$ und $\sigma_Z=1$|||--> | + | |
</ | </ | ||