Was ist Statistik?
Bevor wir uns in Formeln und Tests stürzen, lohnt ein Schritt zurück: Was macht Statistik eigentlich? Kurz gesagt ist sie die Kunst, aus Daten vernünftige Schlüsse zu ziehen, und ehrlich zu sagen, wie sicher diese Schlüsse sind. In dieser Lektion bekommst du die Landkarte, auf der sich alle späteren Themen einordnen lassen.
Man teilt die Statistik traditionell in drei Teilgebiete ein. Sie schließen sich nicht aus, sondern beantworten unterschiedliche Fragen an deine Daten. Schauen wir sie der Reihe nach an.
Die drei Teilgebiete
Die ist die bescheidenste der drei: Sie beschreibt und fasst zusammen, was du ohnehin schon hast. Ein Mittelwert, ein Anteil in Prozent, ein Histogramm: all das verdichtet einen Haufen Zahlen zu etwas Greifbarem. Sie geht aber nie über die gemessenen Daten hinaus; sie behauptet nichts über Fälle, die du nicht gesehen hast.
Die , auch schließende oder induktive Statistik genannt, geht den entscheidenden Schritt weiter. Sie schließt von der auf die . Du hast nur ein paar Hundert Menschen befragt, möchtest aber etwas über Millionen sagen. Das passiert auf zwei Wegen: durch Schätzen (z. B. ein für den wahren Wert) und durch Testen (z. B. die Frage, ob ein beobachteter Unterschied echt ist oder bloß Zufall).
Die schließlich durchstöbert Daten auf der Suche nach Mustern und erzeugt daraus neue, testbare Hypothesen. Sie liefert noch keine gesicherten Antworten, sondern gute Fragen: „Hier scheint etwas zu sein — das sollten wir genauer untersuchen.“ Sie entdeckt, sie bestätigt nicht.
Grundgesamtheit und Stichprobe
Diese beiden Begriffe begleiten dich durch die gesamte schließende Statistik, also lohnt es sich, sie sauber auseinanderzuhalten. Die sind alle Fälle, über die du eigentlich etwas wissen möchtest, etwa alle Wahlberechtigten eines Landes. Die ist die Teilmenge, die du tatsächlich gemessen hast. Fast immer ist die Grundgesamtheit zu groß, um sie komplett zu erfassen; deshalb arbeitest du mit einer Stichprobe und schließt von ihr zurück.
Skalenniveaus: Wie reichhaltig ist eine Messung?
Bevor du eine einzige Zahl berechnest, lohnt eine Frage: Was für eine Art von Variable hast du da überhaupt gemessen? Nicht jede Zahl darf man gleich behandeln. Das sagt dir, wie „reichhaltig“ eine Variable ist, und damit, welche Rechnungen und welche Tests erlaubt sind. Man unterscheidet drei Stufen, die aufeinander aufbauen.
Auf der untersten Stufe steht die . Hier gibt es nur Kategorien ohne Rangfolge. Du kannst nur sagen, ob zwei Fälle gleich oder ungleich sind. Die Art eines gefangenen Tieres (Lachs, Forelle, Hecht), das Geschlecht oder die Blutgruppe sind nominal. „Lachs ist größer als Forelle“ ergibt als Skala keinen Sinn; du darfst nur zählen, wie oft jede Kategorie vorkommt.
Eine Stufe darüber liegt die . Jetzt gibt es eine Rangfolge, aber die Abstände sind nicht gleich groß. Klassische Beispiele aus der Biologie sind Bonituren und Rangstufen: ein Befall „gering – mittel – stark“, eine Blühintensität von 1 bis 5. Du darfst die Stufen ordnen, aber nicht sagen, der Sprung von „gering“ zu „mittel“ sei genauso groß wie der von „mittel“ zu „stark“. Mittelwerte sind hier mit Vorsicht zu genießen, der Median passt besser.
Ganz oben steht die : echte Zahlen mit gleichen, sinnvollen Abständen. Die Körperlänge eines Lachses, das Gewicht einer Daphnie, die Temperatur eines Gewässers. Hier darfst du Differenzen bilden und rechnen. Die metrische Skala teilt man noch einmal feiner auf:
- Die hat gleiche Abstände, aber keinen echten Nullpunkt. Die Temperatur in °C ist das Standardbeispiel: 20 °C ist nicht „doppelt so warm“ wie 10 °C, weil der Nullpunkt willkürlich gesetzt ist. Differenzen sind sinnvoll, Verhältnisse nicht.
- Die hat zusätzlich einen echten Nullpunkt (null bedeutet „nichts davon“). Länge, Gewicht, Anzahl Eier. Hier sind auch Verhältnisse sinnvoll: ein 6 cm langer Fisch ist doppelt so lang wie ein 3 cm langer.
Probier es selbst aus
Die Theorie sitzt am besten, wenn du sie anwendest. Unten findest du acht alltägliche Aussagen. Entscheide bei jeder, ob sie nur beschreibt (deskriptiv), auf die Grundgesamtheit schließt (inferentiell) oder eine neue Hypothese entdeckt (explorativ). Du bekommst sofort eine Rückmeldung mit kurzer Begründung.
Sortier-Spiel: Welche Statistik ist das?
Lies jede Aussage und ordne sie einem der drei Teilgebiete zu. Du bekommst sofort eine Rückmeldung.
Der Mittelwert der Körpergröße in der Klasse beträgt 178 cm.
Mit 95 % Sicherheit liegt der wahre Mittelwert zwischen 1,75 m und 1,81 m.
Auffällig: Pflanzen im Schatten scheinen kleinere Blätter zu haben — das könnte man testen.
Ein Histogramm zeigt, wie sich die Einkommen in der Befragung verteilen.
Der t-Test ergibt p = 0,02; der Unterschied zwischen den Gruppen ist signifikant.
In den Verkaufszahlen fällt ein Muster auf: montags wird mehr gekauft. Woran könnte das liegen?
63 % der Befragten haben mit "Ja" geantwortet.
Wir schätzen, dass der neue Dünger den Ertrag im Mittel um etwa 12 % erhöht.
Beobachten oder eingreifen?
Eine der wichtigsten Unterscheidungen überhaupt betrifft die Art, wie Daten entstehen. In einer beobachtenden Studie schaust du nur zu und misst, was ohnehin passiert. In einem manipulativen (kontrollierten) Experiment greifst du selbst ein: Du setzt gezielt eine Ursache und teilst die Fälle am besten zufällig auf Gruppen auf.
Dieser Unterschied entscheidet darüber, ob du einen ziehen darfst. Nur das kontrollierte Experiment erlaubt die Aussage „A verursacht B“. Beim reinen Beobachten lauert immer ein : eine dritte Größe, die sowohl A als auch B beeinflusst und so einen Zusammenhang vortäuscht, den es gar nicht gibt.
Entdecken oder prüfen?
Eng damit verwandt ist die Frage, ob du Daten explorativ oder konfirmatorisch verwendest. Explorativ heißt: Du durchsuchst die Daten offen nach Auffälligkeiten und entwickelst Hypothesen. Konfirmatorisch heißt: Du hast vorab eine klare Hypothese und prüfst gezielt, ob die Daten sie stützen.
Die Falle dabei: Eine Hypothese, die du erst in einem Datensatz gefunden hast, darfst du nicht an genau denselben Daten als „bestätigt“ ausgeben. Wer lange genug sucht, findet in jedem Datensatz ein Muster, auch eines, das nur Zufall ist. Eine explorativ entdeckte Hypothese braucht zur Bestätigung neue, unabhängige Daten.
Sitzt es? Vier kurze Fragen
Keine Prüfung, nur eine Selbstkontrolle. Du bekommst zu jeder Frage sofort eine Erklärung.
Selbsttest
Beantworte die Fragen. Du bekommst sofort eine Rückmeldung.
1. Du berechnest den Durchschnittslohn aller Befragten und zeichnest dazu ein Histogramm. Welches Teilgebiet ist das?
2. Warum erlauben nur kontrollierte (manipulative) Experimente einen sauberen Kausalschluss?
3. Eine Hypothese, die du explorativ in einem Datensatz entdeckt hast, darfst du an genau denselben Daten als bestätigt ansehen.
4. Du notierst bei gefangenen Fischen den Befall mit Parasiten in den Stufen „gering – mittel – stark“. Welches Skalenniveau hat diese Variable?