Klausur-relevant · Testen

Chi-Quadrat-Tests

Bisher ging es um Mittelwerte und Streuungen, gemessene Größen wie die Zugdistanz in Kilometern. Jetzt geht es um etwas anderes: ums Zählen. Wie viele Erbsen sind gelb-rund, wie viele grün-runzlig? Wie viele Tiere einer Art leben in welchem Habitat? Solche kategorialen Häufigkeitsdaten wertet der aus. In dieser Lektion lernst du die eine Intuition, die alles trägt: χ² misst, wie weit das, was du gezählt hast, von dem abweicht, was du bei reinem Zufall erwarten würdest.

Die zentrale Idee: beobachtet gegen erwartet

Stell dir χ² als ehrliche Buchhaltung der Überraschung vor. Für jede Kategorie hast du eine beobachtete Anzahl B (das, was du gezählt hast) und eine erwartete Anzahl E (das, was ein Modell vorhersagt). χ² summiert die quadrierten Abweichungen (B − E)², jede aber relativiert an ihrem eigenen Erwartungswert E. So zählt eine Abweichung von 10 bei E = 5 viel schwerer als dieselbe 10 bei E = 1000.

Variante 1: Der Anpassungstest (goodness of fit)

Der beantwortet die Frage: Folgen meine beobachteten Häufigkeiten einer erwarteten Verteilung? Das klassische Beispiel kommt aus der Genetik. Mendel kreuzte Erbsen, die sich in zwei Merkmalen unterschieden (Form und Farbe), und erwartete in der F₂-Generation das berühmte 9:3:3:1-Spaltungsverhältnis der vier Phänotyp-Klassen.

Aus N = 556 Pflanzen zählte Mendel: 315 rund-gelb, 101 runzlig-gelb, 108 rund-grün, 32 runzlig-grün. Das Modell 9:3:3:1 sagt für N = 556 die erwarteten Anzahlen 312,8 · 104,3 · 104,3 · 34,8 voraus (also N mal 9/16, 3/16, 3/16, 1/16). Passt das beobachtete zum erwarteten Verhältnis?

Variante 2: Der Unabhängigkeitstest (Kontingenztafel)

Die zweite Variante prüft, ob zwei kategoriale Merkmale unabhängig sind. Beispiel: Du fängst Tiere zweier Arten und notierst, in welchem von zwei Habitaten sie leben. Das ergibt eine , eine Kreuztabelle der Anzahlen:

Habitat 1Habitat 2Σ Zeile
Art A301040
Art B122840
Σ Spalte423880

Die Nullhypothese lautet: Art und Habitat sind unabhängig. Die Habitatwahl hängt nicht von der Art ab. Wären sie unabhängig, müsste sich jede Zelle aus ihren Rändern ergeben: aus der Zeilensumme (wie viele Tiere der Art) und der Spaltensumme (wie viele Tiere im Habitat), geteilt durch die Gesamtzahl N. Genau das ist die Formel für die .

Für unsere Tafel ist z. B. E11 = (40·42)/80 = 21 erwartete Tiere der Art A in Habitat 1, beobachtet sind aber 30. Die Art A sitzt also häufiger in Habitat 1, als Unabhängigkeit erwarten ließe. Ob diese Abweichung signifikant ist, sagt χ². Probier es gleich selbst aus.

Selbst ausprobieren: der Kontingenztafel-Editor

Tipp links die beobachteten Anzahlen ein. Rechts berechnen sich live die erwarteten Werte E aus den Rändern, der Beitrag (B − E)²/E jeder Zelle (je kräftiger gefärbt, desto mehr trägt sie bei) und unten χ², df und der p-Wert. Probier:

  1. Mach die Verteilung gleichmäßiger (z. B. überall 20): Die Beiträge schrumpfen, χ² geht gegen 0, p steigt, kein Zusammenhang mehr.
  2. Verschärf den Kontrast (z. B. 38/2 und 4/36): Die Beiträge leuchten auf, χ² steigt, p sinkt.
  3. Setz eine Zelle sehr klein, bis ein E < 5 auftaucht — die Warnung erscheint: lieber Fisher-Test.
  4. Schalte die Yates-Korrektur an und aus — bei 2×2 verkleinert sie χ² etwas (konservativer).

Kontingenztafel-Editor: χ² zum Anfassen

Tipp beobachtete Anzahlen ein (Art × Habitat). Rechts berechnen sich die erwarteten Werte E aus den Rändern, der Beitrag (B − E)²/E je Zelle und unten χ², df und der p-Wert — live.

χ² = 14,49
df = 1
p = < 0,001 · signifikant

Beobachtet (B)

Habitat 1Habitat 2Σ Zeile
Art A40
Art B40
Σ Spalte423880

Nur ganze Anzahlen — keine Prozente, keine Mittelwerte. Die Zeilen- und Spaltensummen (die Ränder) speisen die erwarteten Werte.

Erwartet (E) & Beitrag (B − E)²/E

Habitat 1Habitat 2
Art A
E = 21,0
3,44
E = 19,0
3,80
Art B
E = 21,0
3,44
E = 19,0
3,80

E = (Zeilensumme · Spaltensumme) / N. Je kräftiger die Zelle, desto mehr trägt sie zu χ² bei. Die Summe aller Beiträge ergibt χ² = 14,49. (Beiträge mit Yates-Korrektur gerechnet.)

Die „erwarteten“ Werte sind keine Daten: Sie verkörpern die Nullhypothese, dass Art und Habitat unabhängig sind. χ² misst, wie weit die beobachteten Zählungen von dieser Unabhängigkeit abweichen — jede Abweichung relativiert an ihrem eigenen Erwartungswert.

Voraussetzungen & Stolpersteine

Der χ²-Test ist eine Näherung: Die Teststatistik folgt nur ungefähr einer χ²-Verteilung. Damit die Näherung trägt, müssen ein paar Dinge stimmen:

So sieht das in R aus

Beide Varianten erledigt chisq.test(). Für den Unabhängigkeitstest übergibst du die Tafel als Matrix. So liest du die Ausgabe:

R Code (nur Anzeige)
# Unabhaengigkeitstest: Art x Habitat (beobachtete Anzahlen)
tafel <- matrix(c(30, 10,
                  12, 28), nrow = 2, byrow = TRUE)
chisq.test(tafel)
Ausgabe
	Pearson's Chi-squared test with Yates' continuity correction

data:  tafel
X-squared = 14.486, df = 1, p-value = 0.0001416
X-squared = 14.486
Die Teststatistik χ². Hier mit Yates-Korrektur (R-Default bei 2×2), daher etwas kleiner als die 16,24 ohne Korrektur.
df = 1
Freiheitsgrade (Zeilen−1)·(Spalten−1) = 1·1 = 1 für eine 2×2-Tafel.
p-value = 0.0001416
Klar kleiner als 0,05 → Art und Habitat sind NICHT unabhängig. Die Habitatwahl hängt von der Art ab.
continuity correction
Verrät, dass R die Yates-Korrektur angewandt hat. Mit chisq.test(tafel, correct = FALSE) bekommst du χ² = 16,24.

Wichtig: Schau dir immer chisq.test(tafel)$expected an. Das gibt die erwarteten Häufigkeiten aus. So prüfst du direkt die Faustregel E ≥ 5, bevor du dem p-Wert traust. Warnt R „Chi-squared approximation may be incorrect“, ist genau das verletzt, und du wechselst auf fisher.test(tafel).

Für den Anpassungstest übergibst du die gezählten Klassen und die erwarteten Anteile p:

R Code (nur Anzeige)
# Anpassungstest: Mendels Erbsen gegen das 9:3:3:1-Verhaeltnis
beobachtet <- c(315, 101, 108, 32)
chisq.test(beobachtet, p = c(9, 3, 3, 1) / 16)
Ausgabe
	Chi-squared test for given probabilities

data:  beobachtet
X-squared = 0.47002, df = 3, p-value = 0.9254
X-squared = 0.47002
Sehr kleines χ²: die gezählten Anzahlen liegen dicht an den erwarteten 312,8 / 104,3 / 104,3 / 34,8.
df = 3
k − 1 = 4 − 1 = 3 Freiheitsgrade bei vier Phänotyp-Klassen.
p-value = 0.9254
Weit über 0,05 → kein Hinweis gegen das Modell. Die Daten passen hervorragend zum 9:3:3:1-Verhältnis.

Sitzt es? Drei kurze Fragen

Keine Prüfung, nur eine Selbstkontrolle. Du bekommst zu jeder Frage sofort eine Erklärung.

Selbsttest

Beantworte die Fragen. Du bekommst sofort eine Rückmeldung.

  1. 1. Du testest eine Kontingenztafel Art × Habitat auf Unabhängigkeit. Was stellen die „erwarteten“ Werte E in der χ²-Rechnung dar?

  2. 2. In deiner 2×2-Tafel Befall (ja/nein) × Behandlung (behandelt/unbehandelt) ist eine Zelle mit erwartetem Wert E = 3 dabei. Was tust du?

  3. 3. Du prüfst Mendels dihybride Erbsen gegen das erwartete Verhältnis 9:3:3:1 (vier Phänotyp-Klassen). Wie viele Freiheitsgrade hat dieser Anpassungstest?