Klausur-relevant · Testen

Chi-Quadrat-Tests

Bisher ging es um Mittelwerte und Streuungen, gemessene Größen wie die Zugdistanz in Kilometern. Jetzt geht es um etwas anderes: ums Zählen. Wie viele Erbsen sind gelb-rund, wie viele grün-runzlig? Wie viele Tiere einer Art leben in welchem Habitat? Solche kategorialen Häufigkeitsdaten wertet der aus. In dieser Lektion lernst du die eine Intuition, die alles trägt: χ² misst, wie weit das, was du gezählt hast, von dem abweicht, was du bei reinem Zufall erwarten würdest.

Kurzer Rückblick auf die letzte Lektion:

Weißt du noch?

Beantworte die Fragen. Du bekommst sofort eine Rückmeldung.

1. Der t-Wert ist ein Signal-zu-Rausch-Verhältnis. Wann wird derselbe Mittelwertunterschied eher signifikant?
2. Ist die Normalverteilungsannahme verletzt, ist der Mann-Whitney-U-Test eine sinnvolle Alternative zum unabhängigen t-Test.

Die zentrale Idee: beobachtet gegen erwartet

Stell dir χ² als ehrliche Buchhaltung der Überraschung vor. Für jede Kategorie hast du eine beobachtete Anzahl B (das, was du gezählt hast) und eine erwartete Anzahl E (das, was ein Modell vorhersagt). χ² summiert die quadrierten Abweichungen (B − E)², jede aber relativiert an ihrem eigenen Erwartungswert E. So zählt eine Abweichung von 10 bei E = 5 viel schwerer als dieselbe 10 bei E = 1000.

Variante 1: Der Anpassungstest (goodness of fit)

Der beantwortet die Frage: Folgen meine beobachteten Häufigkeiten einer erwarteten Verteilung? Das klassische Beispiel kommt aus der Genetik. Mendel kreuzte Erbsen, die sich in zwei Merkmalen unterschieden (Form und Farbe), und erwartete in der F₂-Generation das berühmte 9:3:3:1-Spaltungsverhältnis der vier Phänotyp-Klassen.

Aus N = 556 Pflanzen zählte Mendel: 315 rund-gelb, 101 runzlig-gelb, 108 rund-grün, 32 runzlig-grün. Das Modell 9:3:3:1 sagt für N = 556 die erwarteten Anzahlen 312,8 · 104,3 · 104,3 · 34,8 voraus (also N mal 9/16, 3/16, 3/16, 1/16). Passt das beobachtete zum erwarteten Verhältnis?

Variante 2: Der Unabhängigkeitstest (Kontingenztafel)

Die zweite Variante prüft, ob zwei kategoriale Merkmale unabhängig sind. Beispiel: Du fängst Tiere zweier Arten und notierst, in welchem von zwei Habitaten sie leben. Das ergibt eine , eine Kreuztabelle der Anzahlen:

	Habitat 1	Habitat 2	Σ Zeile
Art A	30	10	40
Art B	12	28	40
Σ Spalte	42	38	80

Die Nullhypothese lautet: Art und Habitat sind unabhängig. Die Habitatwahl hängt nicht von der Art ab. Wären sie unabhängig, müsste sich jede Zelle aus ihren Rändern ergeben: aus der Zeilensumme (wie viele Tiere der Art) und der Spaltensumme (wie viele Tiere im Habitat), geteilt durch die Gesamtzahl N. Genau das ist die Formel für die .

Für unsere Tafel ist z. B. E₁₁ = (40·42)/80 = 21 erwartete Tiere der Art A in Habitat 1, beobachtet sind aber 30. Die Art A sitzt also häufiger in Habitat 1, als Unabhängigkeit erwarten ließe. Ob diese Abweichung signifikant ist, sagt χ². Probier es gleich selbst aus.

Selbst ausprobieren: der Kontingenztafel-Editor

Tipp links die beobachteten Anzahlen ein. Rechts berechnen sich live die erwarteten Werte E aus den Rändern, der Beitrag (B − E)²/E jeder Zelle (je kräftiger gefärbt, desto mehr trägt sie bei) und unten χ², df und der p-Wert. Probier:

Mach die Verteilung gleichmäßiger (z. B. überall 20): Die Beiträge schrumpfen, χ² geht gegen 0, p steigt, kein Zusammenhang mehr.
Verschärf den Kontrast (z. B. 38/2 und 4/36): Die Beiträge leuchten auf, χ² steigt, p sinkt.
Setz eine Zelle sehr klein, bis ein E < 5 auftaucht — die Warnung erscheint: lieber Fisher-Test.
Schalte die Yates-Korrektur an und aus — bei 2×2 verkleinert sie χ² etwas (konservativer).

Kontingenztafel-Editor: χ² zum Anfassen

Tipp beobachtete Anzahlen ein (Art × Habitat). Rechts berechnen sich die erwarteten Werte E aus den Rändern, der Beitrag (B − E)²/E je Zelle und unten χ², df und der p-Wert — live.

Beobachtet (B)

	Habitat 1	Habitat 2	Σ Zeile
Art A			40
Art B			40
Σ Spalte	42	38	80

Nur ganze Anzahlen — keine Prozente, keine Mittelwerte. Die Zeilen- und Spaltensummen (die Ränder) speisen die erwarteten Werte.

Erwartet (E) & Beitrag (B − E)²/E

	Habitat 1	Habitat 2
Art A	E = 21,0 3,44	E = 19,0 3,80
Art B	E = 21,0 3,44	E = 19,0 3,80

E = (Zeilensumme · Spaltensumme) / N. Je kräftiger die Zelle, desto mehr trägt sie zu χ² bei. Die Summe aller Beiträge ergibt χ² = 14,49. (Beiträge mit Yates-Korrektur gerechnet.)

χ² = 14,49

df = 1

p = < 0,001 · signifikant

Die „erwarteten“ Werte sind keine Daten: Sie verkörpern die Nullhypothese, dass Art und Habitat unabhängig sind. χ² misst, wie weit die beobachteten Zählungen von dieser Unabhängigkeit abweichen — jede Abweichung relativiert an ihrem eigenen Erwartungswert.

Yates-Korrektur (R-Default bei 2×2, df = 1)

Voraussetzungen & Stolpersteine

Der χ²-Test ist eine Näherung: Die Teststatistik folgt nur ungefähr einer χ²-Verteilung. Damit die Näherung trägt, müssen ein paar Dinge stimmen:

So sieht das in R aus

Beide Varianten erledigt chisq.test(). Für den Unabhängigkeitstest übergibst du die Tafel als Matrix. So liest du die Ausgabe:

R Code (nur Anzeige)

# Unabhaengigkeitstest: Art x Habitat (beobachtete Anzahlen)
tafel <- matrix(c(30, 10,
                  12, 28), nrow = 2, byrow = TRUE)
chisq.test(tafel)

Ausgabe

	Pearson's Chi-squared test with Yates' continuity correction

data:  tafel
X-squared = 14.486, df = 1, p-value = 0.0001416

X-squared = 14.486: Die Teststatistik χ². Hier mit Yates-Korrektur (R-Default bei 2×2), daher etwas kleiner als die 16,24 ohne Korrektur.
df = 1: Freiheitsgrade (Zeilen−1)·(Spalten−1) = 1·1 = 1 für eine 2×2-Tafel.
p-value = 0.0001416: Klar kleiner als 0,05 → Art und Habitat sind NICHT unabhängig. Die Habitatwahl hängt von der Art ab.
continuity correction: Verrät, dass R die Yates-Korrektur angewandt hat. Mit chisq.test(tafel, correct = FALSE) bekommst du χ² = 16,24.

Wichtig: Schau dir immer chisq.test(tafel)$expected an. Das gibt die erwarteten Häufigkeiten aus. So prüfst du direkt die Faustregel E ≥ 5, bevor du dem p-Wert traust. Warnt R „Chi-squared approximation may be incorrect“, ist genau das verletzt, und du wechselst auf fisher.test(tafel).

Für den Anpassungstest übergibst du die gezählten Klassen und die erwarteten Anteile p:

R Code (nur Anzeige)

# Anpassungstest: Mendels Erbsen gegen das 9:3:3:1-Verhaeltnis
beobachtet <- c(315, 101, 108, 32)
chisq.test(beobachtet, p = c(9, 3, 3, 1) / 16)

Ausgabe

	Chi-squared test for given probabilities

data:  beobachtet
X-squared = 0.47002, df = 3, p-value = 0.9254

X-squared = 0.47002: Sehr kleines χ²: die gezählten Anzahlen liegen dicht an den erwarteten 312,8 / 104,3 / 104,3 / 34,8.
df = 3: k − 1 = 4 − 1 = 3 Freiheitsgrade bei vier Phänotyp-Klassen.
p-value = 0.9254: Weit über 0,05 → kein Hinweis gegen das Modell. Die Daten passen hervorragend zum 9:3:3:1-Verhältnis.

Sitzt es? Drei kurze Fragen

Keine Prüfung, nur eine Selbstkontrolle. Du bekommst zu jeder Frage sofort eine Erklärung.

Selbsttest

Beantworte die Fragen. Du bekommst sofort eine Rückmeldung.

1. Du testest eine Kontingenztafel Art × Habitat auf Unabhängigkeit. Was stellen die „erwarteten“ Werte E in der χ²-Rechnung dar?
2. In deiner 2×2-Tafel Befall (ja/nein) × Behandlung (behandelt/unbehandelt) ist eine Zelle mit erwartetem Wert E = 3 dabei. Was tust du?
3. Du prüfst Mendels dihybride Erbsen gegen das erwartete Verhältnis 9:3:3:1 (vier Phänotyp-Klassen). Wie viele Freiheitsgrade hat dieser Anpassungstest?
4. Dein χ²-Unabhängigkeitstest der Tafel Habitat × Befall wird signifikant (p < 0,01). Was darfst du daraus schließen?