Statistik-Problem mit "Sieben"
-
Hallo Leute,
ich habe folgendes Problem, bei dem ich irgendwie den Wald nicht vor Bäumen sehe. Das Problem ist natürlich "übersetzt", d. h. eigentlich handelt es sich nur um ein analoges Problem (Werte in Datenbank-Tabellen, die entlang von bestimmten Pfad das Laden weiterer Werte triggern). Allerdings wird es so, wie ich es dir formuliere wahrscheinlich verständlicher:
Bälle mit verschiedenen Attributen, z. B. Farbe, Gewicht, Oberfläche usw. fallen durch eine Reihe von „Sieben“. Das erste Sieb filtert rote Bälle aus, das zweite Sieb filtert Bälle aus, die schwerer als 100 Gramm sind, das dritte Sieb filtert Bälle aus, die flauschig sind.
Statistisch sind uns die Schnittmengen bekannt: wir wissen z. B., 10 Prozent aller roten Bälle sind flauschig, 50 Prozent aller roten Bälle wiegen mehr als 100 Gramm, 40 Prozent aller Bälle die weniger oder gerade 100 Gramm wiegen sind flauschig.
Außerdem wissen wir, dass beim ersten Sieb 100 rote Bälle durch gekommen sind, wovon nur 50 Bälle das zweite Sieb passieren konnten (eben nach der Statistik:50 Prozent aller roten Bälle wiegen mehr als 100 Gramm).
Bei Sieb 3 kommen also 50 Bälle an. Wir wissen, dass diese Bälle alle weniger oder gleich 100 Gramm wiegen. Nach der Statistik wären hiervon 20 Bälle flauschig (40 Prozent der 50 ankommenden Bälle). Auf der anderen Seite wissen wir, dass alle Bälle rot sind. Nach der Statistik wären also nur 5 Bälle flauschig (10 Prozent der ankommenden roten Bälle).
Welche richtige Statistik muß angewendet werden? Wie kann man richtig berechnen (mit dem Wissen, dass wir haben), wie viele der ankommenden Bälle flauschig sind?
vielleicht kann mir jemand einen Tip geben, in welche Richtung ich denken muß.
Vielen lieben dank schon mal im voraus und euch allen noch frohe Ostern
- Chris