Grundlagen · Schätzen

Schätzen & Konfidenzintervalle

Im letzten Kapitel hast du gesehen: Ein Stichprobenmittelwert ist nicht „die Wahrheit“, sondern eine zufällige Ziehung. In dieser Lektion machen wir das nutzbar. Otto hat 20 Vögel einer Art besendert und ihre Zugdistanz gemessen; daraus will er auf die wahre mittlere Zugdistanz der ganzen Art schließen, und ehrlich dazu sagen, wie präzise er sie damit eingegrenzt hat. Am Ende steht ein Satz, den fast alle falsch deuten, und du wirst ihn richtig verstehen.

Kennwert oder Parameter?

Die ganze schließende Statistik dreht sich um eine Unterscheidung. Auf der einen Seite steht der : eine Größe, die du aus deiner berechnest: der Mittelwert , die Standardabweichung s. Kennwerte schreibt man mit lateinischen Buchstaben, und sie schwanken von Stichprobe zu Stichprobe.

Auf der anderen Seite steht der : eine feste, meist unbekannte Größe der : der wahre Mittelwert μ, die wahre Standardabweichung σ. Parameter schreibt man mit griechischen Buchstaben, und sie ändern sich nicht. Dein Ziel: vom beobachteten Kennwert auf den unbekannten Parameter schließen.

Der Punktschätzer und seine Treue

Der einfachste Weg, μ zu schätzen, ist ein : eine einzelne Zahl. Für μ nimmt man naheliegenderweise x̄. Was diesen Schätzer gut macht, ist seine (englisch unbiased): Er trifft im Mittel über alle möglichen Stichproben genau den wahren Wert. Er ist also nicht systematisch zu hoch oder zu niedrig, nur eben von Stichprobe zu Stichprobe verstreut.

Warum durch n − 1? Die Sache mit den Freiheitsgraden

Bei der Stichprobenvarianz teilt man die Summe der quadrierten Abweichungen nicht durch n, sondern durch n − 1. Das wirkt willkürlich — ist es aber nicht. Der Grund steckt darin, dass du die Abweichungen um misst, und x̄ hast du selbst aus denselben Daten geschätzt.

Die Daten liegen per Konstruktion möglichst nah an ihrem eigenen x̄, näher, als sie im Schnitt am wahren μ lägen. Würdest du durch n teilen, unterschätztest du σ² deshalb systematisch. Ein ist bereits für die Schätzung von x̄ „verbraucht“: Kennst du x̄ und n − 1 der Werte, liegt der letzte fest. Es bleiben nur n − 1 frei variierbare Abweichungen, und genau durch diese Zahl wird geteilt.

Der Standardfehler: wie sehr x̄ schwankt

Wenn x̄ von Stichprobe zu Stichprobe schwankt — wie stark tut es das? Das misst der (SE). Er ist die Standardabweichung der Stichprobenkennwertverteilung und damit das Maß für die Unsicherheit deiner Schätzung.

Der √n im Nenner ist die zentrale Botschaft: Mehr Daten machen die Schätzung präziser, aber mit abnehmendem Ertrag. Willst du den Standardfehler halbieren, brauchst du die vierfache Stichprobe.

Vom Punkt zum Intervall: das Konfidenzintervall

Ein einzelner Punktschätzer verschweigt seine Unsicherheit. Ehrlicher ist ein (KI): ein ganzer Bereich um x̄ herum, der den wahren Wert plausibel einschließt. Du baust ihn, indem du an x̄ ein Vielfaches des Standardfehlers anhängst, nach beiden Seiten, denn ein KI ist immer zweiseitig.

Das (z. B. 95 %) legt fest, wie „großzügig“ das Intervall ist; sein Gegenstück ist das Risiko α = 1 − Niveau (bei 95 % also α = 5 %), das sich zu gleichen Teilen auf beide Enden verteilt. Die wichtigsten z-Werte solltest du im Kopf haben:

  • 90 % Konfidenz → z ≈ 1,65
  • 95 % Konfidenz → z ≈ 1,96
  • 99 % Konfidenz → z ≈ 2,58

Die eine Deutung, die fast alle falsch machen

Probier es selbst aus: die Sampling-Maschine

Hier wird die richtige Deutung anfassbar. Das wahre μ, die wahre mittlere Zugdistanz der Art, steht als rote Linie fest und bewegt sich nie. Jede Stichprobe (eine neue Gruppe besenderter Vögel) erzeugt ein Konfidenzintervall, das darunter gestapelt wird. Geh am besten so vor:

  1. Klick ein paarmal auf „Stichprobe ziehen“ (als würdest du jedes Mal eine neue Gruppe Vögel besendern) und beobachte, wie die Intervalle um die feste μ-Linie tanzen; manche treffen, manche verfehlen.
  2. Drück „100 ziehen“ und sieh zu, wie der Trefferanteil sich beim Konfidenzniveau einpendelt (~95 %).
  3. Stell das Niveau auf 99 %: Die Intervalle werden breiter und es gibt weniger Fehlschüsse. Auf 90 % werden sie schmaler, dafür verfehlen mehr.
  4. Erhöh n: Die Intervalle werden schmaler (der Standardfehler sinkt), der Trefferanteil bleibt aber beim Niveau.

Sampling-Maschine: Was 95 % Konfidenz wirklich bedeuten

Das wahre μ steht fest (rote Linie). Zieh Stichproben — jede liefert ein Intervall. Beobachte, wie ungefähr 95 % der Intervalle das feste μ einfangen. Nicht das μ wandert, sondern die Intervalle.

Treffer 0 von 0 (– %) Ziel: 95 % · 0 verfehlt
−3 SE−2 SE−1 SEμ+1 SE+2 SE+3 SEwahres μ = 100Noch keine Stichprobe gezogen — klick unten auf „Stichprobe ziehen“.

Jede waagerechte Linie ist ein 95-%-KI (hier mit bekanntem σ, daher z-basiert: x̄ ± z·σ/√n). Grüne Intervalle enthalten das feste μ, rote verfehlen es. Der Trefferanteil pendelt sich beim Konfidenzniveau ein.

Konfidenzniveau
z = 1,96 · KI-Breite ±6,6
5 100

z oder t? Kleine Stichproben brauchen breitere Netze

Den z-Wert darfst du nur verwenden, wenn σ bekannt ist oder die Stichprobe groß ist. Bei kleinem n und unbekanntem σ musst du σ durch s schätzen, und diese zusätzliche Unsicherheit muss ins Intervall. Dafür gibt es die : glockenförmig wie die Normalverteilung, aber mit schwereren Rändern. Ihre Form hängt von den Freiheitsgraden df = n − 1 ab.

Konkret für ein 95-%-KI (zweiseitig, also das 0,975-Quantil): Der z-Wert ist 1,960. Bei einer kleinen Stichprobe von n = 10 (df = 9) ist der t-Wert dagegen 2,262, deutlich größer, das Intervall also breiter. Bei n = 31 (df = 30) sind es nur noch 2,042, schon nah an z. Je größer die Stichprobe, desto mehr verschmilzt t mit z.

Wie viele Daten brauche ich? Der Mindeststichprobenumfang

Die KI-Formel lässt sich umdrehen. Will Otto, dass sein 95-%-Intervall für die mittlere Zugdistanz höchstens eine gewünschte Genauigkeit E (die halbe Intervallbreite, der „Fehler“) hat, kann er den nötigen Stichprobenumfang (also wie viele Vögel er besendern muss) vorab ausrechnen:

Das Quadrat ist die Kehrseite des √n von vorhin: Doppelt so genau (halbes E) zu sein, kostet die vierfache Stichprobe. Präzision ist teuer.

Sitzt es? Drei kurze Fragen

Keine Prüfung, nur eine Selbstkontrolle. Du bekommst zu jeder Frage sofort eine Erklärung.

Selbsttest

Beantworte die Fragen. Du bekommst sofort eine Rückmeldung.

  1. 1. Otto hat aus 20 besenderten Vögeln ein 95-%-Konfidenzintervall für die mittlere Zugdistanz der Art berechnet. Welche Aussage ist die korrekte frequentistische Deutung?

  2. 2. Warum teilt man bei der Stichprobenvarianz durch n − 1, und was passiert mit der Breite des Konfidenzintervalls, wenn n wächst?

  3. 3. Ein 99-%-Konfidenzintervall ist breiter als ein 95-%-Konfidenzintervall.