auf normalverteilung überprüfen
-
hallo,
ich habe eine zufallsvariable und eine stichprobe von ca. 500 werten. wie kann ich nun mathematisch überprüfen ob diese zufallsvariable normalverteilt ist oder nicht?
ein statistikprogramm für linux, das dies beherrscht, wäre auch gut. müsste aber definitiv ein konsolenprogramm sein. kennt jemand sowas?
-
Überprüfen kannst Du das, indem Du mal schaust, was für eine Normalverteilung Du aus der Stichprobe schätzen kannst. Dazu mußt Du eigentlich nur Mittelwert und Standardabweichung schätzen.
Mittelwert kriegste durch auffsummieren aller Daten und dann Division durch Anzahl der Daten. Standardabweichung ist Wurzel aus der Varianz. Die kriegst Du, in dem Du den quadrierten Abstand aller Werte zum Mittelwert aufsummierst und danach durch n-1 teilst. Daraus die Wurzel ist dann die Standardabweichung. Durch diese beiden Parameter ist dann eine Normalverteilung bestimmt. Danach mußte prüfen, ob die zu Deinen Wert paßt. Dafür kannste ja mal plotten oder quadratische Abweichung als Fehlermaß benutzen. Gibt bestimmt noch was besseres, aber da kenne ich mich nicht so sehr aus.
Schlag auch die Formeln besser nochmal bei wikipedia nach.
MfG Jester
-
Derartige Verteilungsannahmen lassen sich, wenn ich mich recht erinnere, mit dem Kolmogoroff-Smirnov-Test prüfen.
-
Es kann auch sehr hilfreich sein, wenn man weiß, woher die Daten kommen. Dann kann man schon aus dieser Richtung erste Vermutungen aufstellen.
-
Hallo
..suchst Du einen Anpassungstest, also als Schnelltest (Ueberschlagsrechnung) schlage ich Dir den David-Quotienten (von Pearson und Stephans) vor: Spannweite / Standardabweichung (die sich daraus ergibt, vgl Jester) und mit Tafel der kritischen Schranken fuer nen David-Quotienten vergleichen - musste evtl noch etwas googeln danach. (Angewandte Statistik, Sachs S. 425)Als Test gibts den Chi-Quadrat-Test auf Anpassung (Angewandte Statistik, Sachs S. 421) und afaik besser dafuer eignet sich der auch schon genannte Kolmogoroff-Smirnoff-Test (Angewandte Statistik, Sachs S. 427) der mit entsprechenden Modifikationen noch etwas getunet werden kann, bspw die Lilliefors is im Sachs genannt (klugscheiss ).
In der Praxis ist es afaik allerdings eher so, dass man das eigentlich nicht wirklich wissen will, da jede Abweichung von der NV mit Problemen verbunden ist und man durch Anzweifeln dieser Tatsache (normalverteilt) sehr schnell zum unbeliebten Ketzer wird - diese Tests sind also eher zum Ablaestern ueber unfaehige Chefs gedacht, denke ich
Edit:
Statistikprogramm fuer Linux faellt mir momentan nich viel ein, ich such auch grad was, aber wills bei mir mit R versuchen. Das gibts auf der Konsole und mit Frontend. R kann das was man eben als Paket noch dazu laed und kann in S3 und S4 (oder S-Plus?!) bedient werden.
Download: http://cran.r-project.org/