Gerd Gigerenzer

Warum fördert es das Verständnis, wenn man die Informationen nicht als Wahrscheinlichkeiten oder Prozentsätze, sondern als natürliche Häufigkeiten angibt? Das hat zwei Gründe. Zum einen ist die Berechnung einfacher, denn die Darstellung erledigt sie schon teilweise. Der zweite Grund liegt in der Evolution unseres Gehirns und der Entwicklung unseres Denkens: Unser Verstand ist eben an natürliche Häufigkeiten angepasst.

Abbildung

Die Verwendung der natürlichen Häufigkeiten erleichtert Berechnungen nach der Bayes'schen Regel. Der fröhlichen Person links wurden die natürlichen Häufigkeiten genannt, und sie konnte sehr leicht die Wahrscheinlichkeit ermitteln, mit der die Krankheit wirklich vorliegt, wenn der Test positiv ausfiel. Sie musste nämlich nur auf zwei Zahlen achten: erstens die Anzahl (a = 7) der Patienten mit positivem Test und der Krankheit und zweitens die Anzahl (b = 70) der Patienten mit positivem Test und ohne Krankheit. Die verwirrte Person rechts erhielt dieselben Informationen jedoch in Form von Wahrscheinlichkeiten und hatte große Mühe.

Die Abbildung illustriert den Unterschied zwischen der Angabe von natürlichen Häufigkeiten und der von Wahrscheinlichkeiten. Links ist ein "Baum" mit den natürlichen Häufigkeiten zu sehen. In dieser Form lernen Menschen statistische Informationen durch direkte Beobachtung. Rechts sind die gleichen Informationen in Form von Wahrscheinlichkeiten angegeben, wie es in den meisten medizinischen Lehrbüchern der Fall ist. Die Formeln in den Denkblasen zeigen die Berechnungen, die erforderlich sind, um die jeweils gestellte Frage zu beantworten. Beide Gleichungen sind Versionen der Bayes'schen Regel, benannt nach dem anglikanischen Geistlichen Thomas Bayes (1702?-1761), dem ihre Entdeckung zugeschrieben wird. Man sieht, dass sich die Wahrscheinlichkeit einer Erkrankung bei einem positiven Test leichter berechnen lässt, wenn die Information in natürlichen Häufigkeiten gegeben wird:

Hier steht "p" für "probability" (englisch für Wahrscheinlichkeit), und der senkrechte Strich "|" vor "pos" steht für "gegeben" ein positives Testergebnis, das heißt, "wenn ein positives Testergebnis vorliegt". In linken Abbildung steht a für die Zahl der Personen, die positiv getestet wurden und erkrankt sind (7), und b für diejenigen, die positiv getestet wurden und nicht erkrankt sind (70). Nimmt man dagegen die Wahrscheinlichkeiten, wird die Berechnung schwieriger:

Bayes'sche Regel für bedingte Wahrscheinlichkeiten

Diese Gleichung entspricht genau der vorigen, einfacheren Formel mit den natürlichen Häufigkeiten. Beide Brüche zeigen den Anteil richtig-positiver Tests (im Zähler) von allen positiven Tests (im Nenner). Im Unterschied zur ersten Formel ist hier jede natürliche Häufigkeit durch das Produkt zweier Wahrscheinlichkeiten ersetzt, weshalb die Berechnung weitaus komplizierter wird. Diese Wahrscheinlichkeiten sind in der folgenden Tabelle näher erklärt:

Tabelle

Ein Test, beispielsweise ein Mammogramm, kann vier Ergebnisse haben: positiv bei Vorliegen der Krankheit, positiv ohne Krankheit, negativ bei Vorliegen der Krankheit sowie negativ ohne Krankheit. Die Anteile, mit denen diese vier Ergebnisse auftreten, nennt man Sensitivität oder Richtigpositiv-Rate, Falsch-positiv-Rate, Falsch-negativ-Rate und Spezifität oder Richtig-negativ-Rate. Die beiden grau unterlegten Felder repräsentieren die beiden möglichen Fehler. Die Häufigkeit von richtig-positiven Ergebnissen ist a und die von falsch-positiven Ergebnissen ist b (siehe Text).

Ein Test kann generell vier Ergebnisse haben. Wenn eine Person eine Krankheit hat, kann der Test entweder positiv (richtig-positiv) oder auch negativ (falsch-negativ) ausfallen. Die Wahrscheinlichkeit p(pos | krank) ist die Sensitivität (Empfindlichkeit) des Tests. Die Sensitivität der Mammographie entspricht dem Anteil der positiven Mammogramme von allen Mammogrammen bei Frauen, die wirklich Brustkrebs haben. Diese Richtig-positiv-Rate der Mammographie liegt normalerweise zwischen 80 und 95 Prozent, mit niedrigeren Werten bei jüngeren Frauen. Die Sensitivität und die Falsch-negativ-Rate summieren sich stets zu 1.

Wenn eine Person dagegen die Krankheit nicht hat, kann der Test entweder positiv (falsch-positiv) oder negativ (richtig-negativ) ausfallen. Auch die Falsch-positiv-Rate und die Spezifität (die Richtignegativ-Rate) summieren sich stets zu 1. Die Wahrscheinlichkeit p(pos | nicht krank) ist die Falsch-positiv-Rate dieses Tests. Im Falle der Mammographie entspricht sie also dem Anteil der positiven Mammogramme von allen Mammogrammen bei Frauen, die in Wahrheit keinen Brustkrebs haben. Sie liegt etwa zwischen 5 und 10 Prozent, mit höheren Werten bei jüngeren Frauen.

Die beiden falschen unter diesen vier Ergebnissen sind in der Tabelle grau unterlegt. Die Anteile der beiden Fehler hängen voneinander ab: Wenn man die Falsch-positiv-Rate eines Tests verringert, so erhöht man die Falsch-negativ-Rate und umgekehrt. Die vier Wahrscheinlichkeiten in der Tabelle heißen bedingte Wahrscheinlichkeiten, weil sie die Wahrscheinlichkeit eines Ereignisses (z. B. eines positiven Mammogramms) für den Fall angeben, dass ein anderes Ereignis eingetreten ist oder eine bestimmte Bedingung erfüllt ist (z. B. das Vorliegen von Brustkrebs). Die nicht bedingte Wahrscheinlichkeit p(krank) ist der Grundanteil der Krebskranken an der betrachteten Bevölkerungsgruppe. Im Unterschied zu Grundanteilen führen bedingte Wahrscheinlichkeiten regelmäßig zur Verwirrung.

Inzwischen verstehen wir sehr genau, warum das so ist. Wenn man eine natürliche Häufigkeit in eine bedingte Wahrscheinlichkeit umrechnet, entfernt man dabei die Information über den Grundanteil (man nimmt eine so genannte Normalisierung vor). Der Vorteil dieser Normalisierung besteht darin, dass die resultierenden Werte stets im Bereich zwischen 0 und 1 liegen. Wenn man jedoch aus Wahrscheinlichkeiten Schlüsse zieht (anstatt aus natürlichen Häufigkeiten), dann muss man die Grundanteile wieder hineinbringen, indem man die Wahrscheinlichkeiten der Ereignisse mit den jeweiligen Grundanteilen multipliziert.

Fassen wir zusammen: Natürliche Häufigkeiten erleichtern es uns, aus numerischen Informationen die richtigen Schlussfolgerungen zu ziehen. Diese Form der Information erledigt dabei schon einen Teil der Arbeit, denn wir müssen nicht erst bedingte Wahrscheinlichkeiten mit dem Grundanteil multiplizieren. Das bedeutet, die Einsicht wird sozusagen von außen mitgeliefert.

Auszug aus "Das Einmaleins der Skepsis"

Über den richtigen Umgang mit Zahlen und Risiken

Von Gerd Gigerenzer

Berlin Verlag, Seite 70 - 73

Abbildung

Bayes'sche Regel für bedingte Wahrscheinlichkeiten

Tabelle