Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
lehrkraefte:ks:ffstat17:start [2018/06/15 11:21] Simon Knaus [Lektion 13] |
lehrkraefte:ks:ffstat17:start [2021/03/25 23:03] (current) Simon Knaus |
||
---|---|---|---|
Line 9: | Line 9: | ||
Ziele der Lektion: | Ziele der Lektion: | ||
* Einführung Freifach | * Einführung Freifach | ||
- | * Unterlagen | + | * Unterlagen |
* Geräte und Tools kennenlernen | * Geräte und Tools kennenlernen | ||
* Erste Berechnungen anstellen | * Erste Berechnungen anstellen | ||
- | ==== Lektion 02/03 ==== | + | |
+ | === Auftrag === | ||
+ | * Einführungsvideo schauen. | ||
+ | * Mittlerer Verkaufspreis (Durchschnitt) aller Autos berechnen | ||
+ | * Mittlerer Verkaufspreis aller weissen Autos berechnen | ||
+ | * Anzahl grüne Autos berechnen | ||
+ | * Welches Modell ist am teuersten? | ||
+ | * Welche Farbe oder Energieeffizienz ist am günstigsten? | ||
+ | ==== Lektion 02/03a ==== | ||
Ziele der Lektion | Ziele der Lektion | ||
* {{lehrkraefte: | * {{lehrkraefte: | ||
Line 54: | Line 62: | ||
</ | </ | ||
==== Lektion 04 ==== | ==== Lektion 04 ==== | ||
- | {{ : | + | {{ : |
=== Ziele === | === Ziele === | ||
* Jede/r kann ein Histogramm erklären. | * Jede/r kann ein Histogramm erklären. | ||
Line 131: | Line 139: | ||
=== Boxplot === | === Boxplot === | ||
- | {{: | + | {{: |
Geogebra kann mit Hilfe von Ansicht -> Tabelle -> Daten eingeben -> Analyse einer Variable -> Boxplot Boxplot-Grafiken erstellen. In Excel ist es auch möglich, allerdings etwas mühsamer. | Geogebra kann mit Hilfe von Ansicht -> Tabelle -> Daten eingeben -> Analyse einer Variable -> Boxplot Boxplot-Grafiken erstellen. In Excel ist es auch möglich, allerdings etwas mühsamer. | ||
=== Boxplot der Preise nach Modell === | === Boxplot der Preise nach Modell === | ||
- | {{ : | + | {{ : |
- | {{ : | + | {{ : |
=== Interpretation Boxplot === | === Interpretation Boxplot === | ||
- | {{ : | + | {{ : |
Line 175: | Line 183: | ||
Zeichnet man nun die Punkte $(\text{Kumulierte relative Anzahl}, | Zeichnet man nun die Punkte $(\text{Kumulierte relative Anzahl}, | ||
- | {{ : | + | {{ : |
Würden alle gleich viel verdienen, lägen die Punkte auf der Winkelhalbierenden. | Würden alle gleich viel verdienen, lägen die Punkte auf der Winkelhalbierenden. | ||
Als Mass der Ungleichverteilung verwendet nun die Fläche, welche die Lorenzkurve mit der Winkelhalbierenden einschliesst. Diese Fläche nennt man auch **Gini--Koeffizient** | Als Mass der Ungleichverteilung verwendet nun die Fläche, welche die Lorenzkurve mit der Winkelhalbierenden einschliesst. Diese Fläche nennt man auch **Gini--Koeffizient** | ||
- | {{ : | + | {{ : |
Als Beispiel für die Lorenzkurve wiederum die 5 BMW Modelle und ihre Preise. Achtung: Es handelt sich dabei nicht um ein Einkommen! | Als Beispiel für die Lorenzkurve wiederum die 5 BMW Modelle und ihre Preise. Achtung: Es handelt sich dabei nicht um ein Einkommen! | ||
- | {{ : | + | {{ : |
Die Lorenzkurve macht im Allgemeinen nur Sinn für Merkmale, mit positiven Werten (Preis, Einkommen, etc.) | Die Lorenzkurve macht im Allgemeinen nur Sinn für Merkmale, mit positiven Werten (Preis, Einkommen, etc.) | ||
Line 413: | Line 421: | ||
=== Lösungen === | === Lösungen === | ||
- | {{ : | + | {{ : |
- | {{ : | + | {{ : |
Berechnet man für die normalen Preise (nicht $\log$) die Regressiongerade, | Berechnet man für die normalen Preise (nicht $\log$) die Regressiongerade, | ||
* x1: $y = -0.3029\cdot x+47132$ | * x1: $y = -0.3029\cdot x+47132$ | ||
Line 604: | Line 612: | ||
* Jede/r kann einen $t$-Test rechnen | * Jede/r kann einen $t$-Test rechnen | ||
* Jede/r hat für sich ein Mini-Projekt gewählt, welches er/sie über die nächsten beiden Male bearbeitet. | * Jede/r hat für sich ein Mini-Projekt gewählt, welches er/sie über die nächsten beiden Male bearbeitet. | ||
+ | |||
=== Auträge === | === Auträge === | ||
+ | * [[https:// | ||
* Theorie unten durcharbeiten | * Theorie unten durcharbeiten | ||
- | * Unterscheiden sich die Preise von weissen | + | * {{lehrkraefte: |
+ | * Erstelle ein Histogramm für die vier Fälle | ||
+ | * Berechne jeweils den Mittelwert | ||
+ | * Führ einen $t$-Test durch um die Mittelwerte in beiden Fällen zu vergleichen. Wie gross ist der $p$-Wert? | ||
+ | * Unterscheidet sich der Preis von schwarz-metallisierten (schwarz mt) und weissen X5er BMWs signifikant? | ||
* Projekt auswählen / kreieren | * Projekt auswählen / kreieren | ||
+ | === Mögliche Projektfragen === | ||
+ | * Welche Farbe hat den höchsten Wiederverkaufswert? | ||
+ | * Bei welchem Modell ist der Zusammenhang zwischen gefahrenen Kilometern und Preis am stärksten? | ||
+ | * Welches ist die beliebeste Farbe? Ist die Modellabhängig? | ||
+ | * Kann von Hubraum auf die Energieeffizient geschlossen werden? | ||
+ | * Haben geschaltete Autos einen tieferen/ | ||
+ | * Bestimme ein einfaches Modell um den Preis eines beliebigen Occassionsauto zu bestimmen. | ||
=== Theorie === | === Theorie === | ||
- | |||
Bei der <<tea tasting lady>> | Bei der <<tea tasting lady>> | ||
* $H_0$: $p=0.5$ (heisst: die Lady kann es nicht, ihr Erfolg ist zufällig) | * $H_0$: $p=0.5$ (heisst: die Lady kann es nicht, ihr Erfolg ist zufällig) | ||
Line 619: | Line 638: | ||
Man sagt $H_0$ auch **Nullhypothese**; | Man sagt $H_0$ auch **Nullhypothese**; | ||
- | Häufig funktionieren Tests aber auch umgekehrt: Das heisst, man formuliert die Nullhypothese ($p=0.5$) und übergibt die Anzahl der richtig erkannten Tassen. Als Resultat (von Hand für uns noch unmöglich; aus Excel oder R) erhält man dann, die Irrtumswahrscheinlichkeit oder den $p$-Wert. Das ist die Wahrscheinlichkeit, | + | Häufig funktionieren Tests aber auch umgekehrt: Das heisst, man formuliert die Nullhypothese ($p=0.5$) und übergibt die Anzahl der richtig erkannten Tassen. Als Resultat (von Hand für uns noch unmöglich; aus Excel oder R) erhält man dann, die Irrtumswahrscheinlichkeit oder den $p$-Wert. Das ist die Wahrscheinlichkeit, |
Das Problem der <<tea tasting lady>> | Das Problem der <<tea tasting lady>> | ||
- | Die Frage ist nun offesnichtlich, | + | Die Frage ist nun offesnichtlich, |
+ | |||
+ | Klar ist, dass man diese Mittelwerte einfach berechnen könnte, diese vergleichen und dann schliessen, dass die eine Gruppe besser ist als die andere. Das Problem dabei ist aber, dass die erbobenen IQ-Werte auch einer gewissen Schankung unterliegen, | ||
+ | |||
+ | |||
+ | {{ : | ||
+ | In der Graphik oben sind zwei Situation illustriert: | ||
+ | |||
+ | Das heisst, man formuliert also die Hypothesen $H_0: | ||
+ | |||
+ | Diese Idee wird nun durch den $t$-Test formalisiert: | ||
+ | |||
+ | Die zentrale Annahme des $t$-Tests ist, dass die beiden zu vergleichenden Grössen normalverteilt sind. Weiter gibt es noch folgende Annahmen, die man spezifieren muss: | ||
+ | * Gepaarter Test: Die beiden Beobachtungen in den Gruppen stammen vom gleichen Subjekt (vorher/ | ||
+ | * Homogene Varianzen: Die Varianz in beiden Gruppen ist gleich gross. | ||
+ | Beide Annahmen müssen spezifiert werden, da die Berechnung anders ausfällt. | ||
+ | * Excel: '' | ||
+ | * R: '' | ||
+ | |||
Line 645: | Line 683: | ||
|Standardabweichung| Wurzel der mittleren quadratischen Abweichung $\sigma=\sqrt{\frac1{n-1}\sum_{i=1}^n (x_i-\bar x)^2}$ | '' | |Standardabweichung| Wurzel der mittleren quadratischen Abweichung $\sigma=\sqrt{\frac1{n-1}\sum_{i=1}^n (x_i-\bar x)^2}$ | '' | ||
|Median| Wert der mittig in der Verteilung aller sortierten Werte ist, resp. zum 50% Prozentrang gehöriger Wert | '' | |Median| Wert der mittig in der Verteilung aller sortierten Werte ist, resp. zum 50% Prozentrang gehöriger Wert | '' | ||
- | |Signifikanz | Prozentzahl welche den Fehler erster Art beschränkt. | | | | + | |Signifikanz | Prozentzahl welche den Fehler erster Art (eines Tests) |
+ | |Test| Eine statistische Entscheidungsregel, | ||
+ | |Nullhypothese| Eine Hypothese, | ||
+ | |Alternativhypothese| Eine Hypothese, die zutrifft, wenn die Nullhypothese nicht zutrifft.| | | | ||
|$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | | | |$p$-Wert | Auch Überschreitungswahrscheinlichkeit oder Signifikanzwert. Wahrscheinlichkeit mit derer ein Fehler erster Art begangen wird.| | | | ||
|$\alpha$-Quantil| Zum Prozentrang $\alpha$ gehöriger Wert | '' | |$\alpha$-Quantil| Zum Prozentrang $\alpha$ gehöriger Wert | '' |