Formel für Dichtefunktion aus Histogramm ermitteln
-
Servus,
wie geht das, ich habe eine Simulation diese liefert mir ein Histogramm und nun hätte ich gerne die Dichtefunktion?
Die wahre Verteilung der Zufallsvariable ist nicht bekannt, auf den allerersten Blick sieht es wie eine Normalverteilung aus, der Kolmogorov-Smirnov-Test sagt bei einigen Stichproben, dass es eine ist, bei anderen, dass es keine ist. Das Ermitteln der mir noch unbekannten Verteilung ist aber Zukunftsmusik, jetzt muss ich erst klären wie ich die Dichtefunktion zu genau einem Histogramm ermitteln kann.
PS: ich habe schon etwas rumgesucht und gelesen, aber ich will jetzt mit meinen Ansätzen nicht schon vorab in die falsche Richtung lenken.
-
Das Histogramm ist doch schon die Dichtefunktion. Solange du die Verteilung nicht kennst, kannst du das schlecht an irgendetwas anfitten. Oder verstehe ich dich falsch?
-
... ich will eigentlich die Wahrscheinlichkeitsfunktion
-
Puh muss mir das nun mal noch klarmachen, was ich eigentlich brauche und will.
Ich mache einen Permutationstest, vereinfacht würfle ich da einen Wert der ganz oft zwischen 0.01 und 0.12 landet. Das mache ich 1000 mal. Das ist das statistische Rauschen. Dann berechne ich in meinem Algorithmus einen Wert nur einmal und muss entscheiden, ob dieser durch Zufall erklärbar ist oder ob das sehr unwahrscheinlich ist. Die nichtzufälligen Werte liegen nämlich höher, so zwischen 0.05 und 0.5.
Naja, jetzt dachte ich muss ich herausfinden, wie die Funktion zum Histogramm ist, dann kann ich mit einer quantifizierbaren irrtumswahrscheinlichkeit sagen: 'kein Zufall' und ich lieg nur zu 1 % falsch.
Aktuell ist es so, dass ich auf der Jagd nach der Funktion zum Histogramm bin, muss aber nun nachdenken ob ich die Dichte oder die Wahrscheinlichkeitsfunktion brauche - bei Histogrammen denke ich aber immer an die Dichte.
Ich habe die absoluten Daten, aus denen mein Histogramm gebaut wird, auf diese Daten kann ich mit R den Kolmogorov-Smirnov-Test ausführen, das ist ja ein nichtparametrischer Test, daher brauche ich keine Verteilung. Allerdings muss ich ohne eine Verteilung im Programm immer die Simulation ausführen lassen und mit einer Verteilung kann ich den Wert einfach berechnen - oder irre ich mich?
-
Ah, so müsste ich doch der Sache auf die Spur kommen: Die Dichtefunktion ist immer die erste Ableitung der Verteilungsfunktion: f(x) = F'(x).
aus: http://de.wikibooks.org/wiki/Mathematik:_Statistik:_Stetige_Zufallsvariablen
-
... ich denke ich brauche ein Verfahren zur Dichteschätzung ... am Ende soll eine Gleichung mit wenigen Parametern stehen - irgendjemand eine Idee?