Varianz - Grundgesamtheit vs. Stichprobe
-
In der Literatur findet man 2 Formeln, für die Varianz.
Einmal die Varianz für die Grundgesamtheit, bei der man durch die Anzahl n teilt
Zum anderen die varianz für die Stichprobe, bei der man durch "n-1" teilt.
Allerdings scheinen mir die Begründungen doch sehr fadenscheinig. Beide Formel bilden eine Metrik für den Abstand arithmetischen Mittel. Die stichprobenvarianz ist zudem noch erwarungstreu.
Ich verstehe nicht wirklich, warum man die Varianz der Grundgesamtheit braucht und wozu Sie gut sein soll. Insbesondere ist mir schleierhaft, warum einige behaupten die Formel für die Stichprobenvarianz wäre falsch, wenn man nicht mit Wahrscheinlichkeiten rechnet.
Mit google habe ich zwar einige Erklärungen gefunden, befriedigend sind diese jedoch allesamt nicht.
-
Das eine ist die konkrete Definition. Kann bei vollstaendigem Wissen angewandt werden. Das zweite ist ein Schaetzer fuer die echte Varianz, wenn ich eben nur eine Stichprobe, also nicht vollstaendiges Wissen, besitze. Die Korrektur durch (n-1) ist deswegen, weil mit nur n die Varianz fuer kleine Stichproben unterschaetzt wird.
Zusammenfassend: math. Definition vs. Schaetzer, zwei verschiedene Dinge also zwei verschiedene Formeln.
-
Wenn du den Erwartungswert schon exakt kennst, teilst du für die Varianz durch n. Wenn du den Erwartungswert auch anhand deiner n Werte schätzen musst und bei der Berechnung der Varianz den geschätzten Erwartungswert einsetzt, dann teilst du für die Varianz durch n-1. Warum das so der richtige Weg ist, kann ich spontan nicht erklären, sorry ... Es hat was mit Freiheitsgraden zu tun. Dadurch, dass du den Mittelwert der n Werte von denselbigen abziehst, hast du nur noch n-1 Freiheitsgrade übrig, da der neue Mittelwert dann ja immer 0 ist. Wenn du allerdings den echten Erwartungswert abziehst, ist der Mittelwert nicht unbedingt 0, weil du ja auch "Pech" haben kannst.
-
das sind ungefähr die Antworten, die man auch sonst in der Literatur finden kann, die mir nicht wirklich weiterhelfen.
Warum sollte die Grundgesamtheit eine andere Varianz haben, als die Stichprobe ?
In mathematischer Literatur gibt es oft nur die Stichprobenvarianz als Definition für die Varianz. Die Varianz der Grundgesamtheit scheint mit eher eine wirtschaftswissenschaftliche Sichtweise zu sein, zu der mir völlig der Zugang fehlt.
By the way: Wenn ich den Erwartungswert kenne, teile ich immer durch "n-1". Denn der Erwartungswert ist ein Begriff aus der Wahrscheinlichkeitsrechnung. Und da nehmen selbst die Wirtschaftswissenschaftler die Stichprobenvarianz.
-
MrBesserwisser schrieb:
Warum sollte die Grundgesamtheit eine andere Varianz haben, als die Stichprobe ?
Hat sie nicht.
In mathematischer Literatur gibt es oft nur die Stichprobenvarianz als Definition für die Varianz.
Ganz sicher nicht.
By the way: Wenn ich den Erwartungswert kenne, teile ich immer durch "n-1".
Nein, wenn du den Erwartungswert kennst, teilt man durch n. Wenn der Erwartungswert nur geschätzt ist, teilt man durch n-1.
Denn der Erwartungswert ist ein Begriff aus der Wahrscheinlichkeitsrechnung. Und da nehmen selbst die Wirtschaftswissenschaftler die Stichprobenvarianz.
Bitte was?