Grundlagen · Wahrscheinlichkeit

Wahrscheinlichkeit & Bayes

Wahrscheinlichkeit ist die Sprache, in der die ganze schließende Statistik spricht. In dieser Lektion legen wir die Bausteine: Was ein Zufallsexperiment ist, wie man Wahrscheinlichkeiten überhaupt bestimmt, mit welchen Regeln man rechnet. Und am Ende wartet der vielleicht überraschendste Satz der ganzen Statistik. Er erklärt, warum ein positiver Krankheitstest oft viel weniger bedeutet, als man denkt, etwa wenn Otto im Feld ein gefangenes Wildtier auf einen seltenen Erreger testet.

Kurzer Rückblick auf die letzte Lektion:

Weißt du noch?

Beantworte die Fragen. Du bekommst sofort eine Rückmeldung.

1. Du fasst deine erhobenen Daten mit Mittelwert und Histogramm zusammen, ohne auf eine größere Grundgesamtheit zu schließen. Welches Teilgebiet ist das?
2. Nur ein kontrolliertes Experiment mit Zufallszuteilung erlaubt einen sauberen Kausalschluss.

Die Grundbegriffe

Alles beginnt mit einem : einem Vorgang, dessen Ausgang ungewiss ist und den man sich beliebig oft wiederholt denken kann: ein Würfelwurf, ein Münzwurf, ein Erreger-Feldtest. Alle möglichen Ergebnisse zusammen bilden den . Beim Würfel ist das {1, 2, 3, 4, 5, 6}. Ein ist dann einfach eine Teilmenge davon, also eine Aussage, die eintreten kann oder nicht, zum Beispiel „eine gerade Zahl würfeln“ = {2, 4, 6}.

Die eines Ereignisses ist eine Zahl zwischen 0 und 1: 0 heißt unmöglich, 1 heißt sicher. Bleibt die Frage, woher diese Zahl kommt.

Woher kommt die Wahrscheinlichkeit?

Es gibt zwei klassische Wege. Wenn alle Ergebnisse gleich wahrscheinlich sind (wie beim fairen Würfel), nutzt du die : günstige durch mögliche Fälle. Für „gerade Zahl“ sind 3 von 6 Ergebnissen günstig, also ist die Wahrscheinlichkeit 3/6 = 0,5.

Oft sind die Ergebnisse aber nicht gleich wahrscheinlich, oder du kennst die „wahre“ Wahrscheinlichkeit gar nicht, etwa ob eine Reißzwecke auf den Kopf oder auf die Seite fällt. Dann hilft die empirische Wahrscheinlichkeit: Du wiederholst das Experiment oft und nimmst die (Treffer geteilt durch Versuche) als Schätzung. Je öfter du wirfst, desto näher liegt dieser Anteil an der wahren Wahrscheinlichkeit.

Kombinatorik: die möglichen Fälle zählen

Die Laplace-Formel verlangt die Anzahl möglicher Fälle. Bei einem Würfel sind das sechs, leicht abgezählt. Aber wie viele Möglichkeiten gibt es, k von n markierten Tieren wieder einzufangen, oder in welcher Reihenfolge drei Würfel fallen können? Hier hilft die , die Kunst des systematischen Zählens. Schon Galileo zählte die Würfe dreier Würfel durch, um zu klären, warum bei drei Würfeln die Augensumme 10 etwas häufiger fällt als die 9 — obwohl sich beide scheinbar gleich oft als Summe darstellen lassen.

Das Fundament ist das (fundamental counting): Hat ein erster Schritt a Möglichkeiten und ein unabhängiger zweiter b, so gibt es zusammen a · b Kombinationen. Drei Würfel haben deshalb 6 · 6 · 6 = 216 mögliche Wurffolgen. Genau dieses „mal“ erklärt, warum die Zahl der Möglichkeiten so schnell groß wird. Ein anderes berühmtes Würfelrätsel ist das de-Méré-Paradox: Wie wahrscheinlich ist mindestens eine Doppelsechs in 24 Würfen zweier Würfel? Auch das löst man, indem man die günstigen gegen die 36²⁴ möglichen Wurffolgen abzählt.

Wenn du k aus n Objekten auswählst, hängt die Anzahl von zwei Fragen ab: Spielt die Reihenfolge eine Rolle? Und legst du ein gezogenes Objekt zurück oder nicht? Daraus ergeben sich vier Fälle.

Zählt die Reihenfolge und ziehst du ohne Zurücklegen, sprichst du von einer : Für das erste Tier hast du n Möglichkeiten, fürs zweite nur noch n − 1 und so weiter, das führt direkt auf n!/(n−k)!. Werden alle n angeordnet, sind es n!.

Ist die Reihenfolge egal (auch ohne Zurücklegen), zählst du jede Gruppe nur einmal, das ist eine . Du teilst die Permutationen noch durch die k! Anordnungen innerhalb jeder Gruppe und erhältst den „n über k“. So zählst du etwa, auf wie viele Arten du k von n markierten Lachsen aus dem Netz greifen kannst.

Darf ein Objekt mehrfach vorkommen (Ziehen mit Zurücklegen, Reihenfolge zählt), bleibt es bei jedem der k Schritte bei allen n Möglichkeiten, das Zählprinzip liefert direkt n^k. Genau so entstehen die 6³ = 216 Wurffolgen dreier Würfel.

Die wichtigsten Rechenregeln

Mit drei Regeln kommst du erstaunlich weit. Du musst sie nicht auswendig lernen. Wichtiger ist, dass du verstehst, warum sie so aussehen.

Die Komplementregel ist die einfachste: Die Wahrscheinlichkeit, dass A nicht eintritt, ist eins minus die Wahrscheinlichkeit, dass es eintritt. Oft ist „nicht A“ viel leichter zu zählen als A selbst.

Die Additionsregel beantwortet „A oder B“. Du addierst beide Wahrscheinlichkeiten, musst aber die Überschneidung wieder abziehen, sonst zählst du sie doppelt.

Die Multiplikationsregel beantwortet „A und B“. Sind beide Ereignisse unabhängig (beeinflusst das eine das andere also nicht), multiplizierst du ihre Wahrscheinlichkeiten einfach.

Bedingte Wahrscheinlichkeit

Spannend wird es, wenn Ereignisse nicht unabhängig sind. Dann ändert das Wissen über B die Wahrscheinlichkeit von A. Genau das beschreibt die P(A|B), gelesen „A unter der Bedingung B“. Du schränkst die Welt auf die Fälle ein, in denen B eingetreten ist, und fragst, welcher Anteil davon auch A ist.

Der Satz von Bayes

Häufig kennst du eine bedingte Wahrscheinlichkeit in der einen Richtung, brauchst aber die andere. Ottos Feldtest sagt ihm P(positiv | infiziert), wie gut er infizierte Tiere erkennt. Ihn interessiert aber P(infiziert | positiv): Ist das gefangene Tier wirklich infiziert, jetzt wo sein Test positiv anschlägt? Der dreht genau diese Richtung um.

Wenden wir das auf Ottos Feldtest an einer Wildpopulation an. Drei Größen reichen aus:

die P(infiziert), also wie verbreitet der Erreger in der Population überhaupt ist,
die P(positiv | infiziert), also wie zuverlässig der Test infizierte Tiere erkennt,
die P(negativ | gesund), also wie zuverlässig er gesunde Tiere als gesund erkennt.

Daraus berechnet Bayes den P(infiziert | positiv), die Zahl, die Otto bei einem positiv getesteten Tier wirklich interessiert.

Probier es selbst aus: die Bayes-Box

Stell dir 10.000 gefangene Tiere als Raster vor. Mit den drei Reglern teilst du sie in vier Gruppen auf. Geh am besten so vor:

Lass die Startwerte stehen (Prävalenz 0,5 %, Sensitivität 99 %, Spezifität 95 %) und schau dir die große Prozentzahl an.
Vergleiche die richtig-positiven mit den falsch-positiven: Obwohl der Test gut ist, dominieren die Fehlalarme.
Zieh nun die Prävalenz hoch (z. B. auf 20 %) und beobachte, wie P(krank | positiv) plötzlich nach oben springt.

Bayes-Box: 10.000 Personen, ein Test

Stell die drei Regler ein und beobachte, wie sich die 10.000 Personen auf die vier Gruppen verteilen — und wie wenige der positiv Getesteten am Ende wirklich krank sind.

Jedes Kästchen ist eine Person (10.000 insgesamt). Oben liegen die positiv Getesteten (Koralle), unten die negativ Getesteten (Salbeigrün). Dunkel = wirklich krank, hell = wirklich gesund.

P(krank | positiv) — wie viele der positiv Getesteten sind wirklich krank?

9,0 %

50 wirklich Kranke von 547 positiv Getesteten.

Richtig-positiv

krank & positiv

Falsch-positiv

497

gesund & positiv

Falsch-negativ

krank & negativ

Richtig-negativ

9.453

gesund & negativ

Prävalenz P(krank) = 0,5 %

0 % 50 %

Sensitivität P(positiv | krank) = 99,0 %

50 % 100 %

Spezifität P(negativ | gesund) = 95,0 %

50 % 100 %

Sitzt es? Drei kurze Fragen

Keine Prüfung, nur eine Selbstkontrolle. Du bekommst zu jeder Frage sofort eine Erklärung.

Selbsttest

Beantworte die Fragen. Du bekommst sofort eine Rückmeldung.

1. Ottos Feldtest auf einen Erreger bei gefangenen Wildtieren hat eine Sensitivität von 99 %. Was bedeutet diese Zahl genau?
2. Der Erreger ist in der Wildpopulation sehr selten (Prävalenz 0,5 %), der Feldtest ist gut (Sensitivität 99 %, Spezifität 95 %). Warum ist ein positiv getestetes Tier trotzdem meist ein Fehlalarm?
3. Eine hohe Sensitivität allein garantiert, dass ein positiv getestetes Wildtier mit hoher Wahrscheinlichkeit auch wirklich infiziert ist.
4. Otto setzt denselben Feldtest (Sensitivität 99 %, Spezifität 95 %) nun in einer Population ein, in der der Erreger häufig ist — Prävalenz 40 % statt 0,5 %. Was passiert mit dem positiven prädiktiven Wert P(infiziert | positiv)?