Korrelationsproblem
-
Ich hoffe, ihr könnt mir helfen. Falls etwas unklar ist, einfach nachfragen, ich versuche alle Rahmenbedingungen zu klären.
Ich habe hier Messergebnisse eines Versuches vorliegen. Im Grunde habe ich 3 Größen, welche ich hier einfach mal x,y und z nennen werde.
x und y sind gewissermaßen voneinander abhängig. Wenn ich jetzt von Ereignissen spreche, ist das wahrscheinlich mathematisch gesehen totaler Müll, aber der Sinn bleibt vielleicht: Y (was zu einem höheren y-Wert führt) kann nur eintreten wenn X (was zu größerem x führt) eingetreten ist.
Ziel von mir ist zu zeigen, OB es einen Zusammenhang zwischen diesen Größen gibt.
Exakter: Hängt z von x und y ab?Wenn es einen Zusammenhang gibt, sollte dieser quantitativ beschrieben werden
( Mögliches erwünschtes Ergebnis: z hängt zu 80% von x und y ab )Ich kenne keine Verteilung der Variablen, noch habe ich eine Modellfunktion gegeben.
Mein bisheriges Vorgehen, man muss dabei sagen, dass ich wenig bis keine Ahnung von Statistik habe :
Ich habe ohne Rücksicht auf die jeweils dritte Variable den Korrelationskoeffizienten nach Pearson x,z und y,z berechnet.
Ich habe dabei bei einem dieser Werte erfreulich hohe Werte bekommen
(zB x,z > 90%) . Ich sollte vielleicht noch sagen, dass ich verschiedene Messungen mit anderen Parametern habe.Nunja. Anschließend habe ich mir mal die plots x gegen z, und y und z angesehen, dabei ist mir aufgefallen, dass bei den Größen anscheinend kein linearer Zusammenhang besteht. Bei den plots zu denen ich hohe Koefizienten bekommen habe, sehe ich parabelast-artige oder e-funktionenartige Kurven.
Der Korrelationskoeffizient nach Pearson ist wenn ich es richtig verstanden habe allerdings nur für lineare Problemstellungen geeignet ist.
Kann ich nun meine bisherigen Erkenntnisse wegwerfen? Oder wie kann ich weiter machen?
-
Korrelation zeigt dir nur, dass eine Zufallsvariable irgendeinen beliebigen Zusammenhang zu einer anderen hat.
Korrelation ist definitiv KEIN Maß für Zusammenhang. Denn ein hoher Korrelationswert kann sowohl bedeuten, dass z von x abhängt, als auch dass x von z abhängt, aber auch dass, x und z gemeinsam von einer unbekannten Variable w abhängen. Dies ist ein grundsätzliches statistisches Problem und eine natürliche Limitierung der empirischen Ansätze.
Grundsätzlich kannst du da erstmal nichts machen, außer ein Modell zu konstruieren, dass deinem Empfinden nach passt. Ohne Plots können wir dir da aber auch nicht helfen.