Methode der kleinsten Quadrate
-
Hallo,
ich versuche, die Methode der kleinsten Quadrate zu verstehen. Bei wikipedia gibt es folgenden Artikel: http://de.wikipedia.org/wiki/Methode_der_kleinsten_Quadrate#Lineare_Modellfunktion
Für den Fall y = x0 + x1t sind die Lösungen gegeben. Ich kann jetzt nur nicht nachvollziehen, wie man auf diese kommt. Mich interessiert nämlich die Lösung für den Fall y = x0t0 + x1t1, wobei x die Parameter und t die Variablen sind. Es ergäbe sich dann für die Matrix A statt (1 t1 ... 1 t2) die Matrix (t01 t11 ... t0n t1n) Sorry für die Schreibweise, aber ich kann kein LaTeX. Was ergibt sich dann für die Lösungen, bzw. wie komme ich auf die Formeln für x0 und x1?Vielen Dank im voraus, mfG D1B
-
Ich glaub, du hast den Ansatz in der Wiki nicht genau verstanden. Gesucht wird einer linare Funtkion , wobei nur eine Reihe von Messwerten zu unterschieldichen Zeitpunkten hat. Die Parameter sollen so bestimmt werden, dass die bestimmte Funktion möglich nah an den Messwerten liegt (also der Fehler minimiert wird).
Hat dir das weiter geholfen? Was meinst du mit deinen unterschiedlich Zeiten t0, t1? Willst du eine Funktion mit zwei Parametern bestimmen ?
-
Ich weiß, dass es um eine lineare Funktion ging, aber mich interessiert ja gerade der Schritt zur Ebenengleichung. Du hast recht, zwei Zeiten sind unglücklich gewählt, aber grundsätzlich geht es mir um eine Funktion, mit zwei Funktionsvariablen, zum Beispiel x1 und x2. Dann suche ich die Parameter p1 und p2 der Funktion y = f(x1,x2) = p1*x1 + p2*x2. Ich habe bloß die Variablen und Parameterbezeichngungen übernommen um zu klarzumachen, was sich wirklich ändert, da dies ja nur die erste Spalte der Matrix A aus dem Beispiel betrifft. Was ergibt sich jetzt für die Lösungen? Ich hoffe es ist jetzt klarer geworden.
-
Google mal nach "multilinearer Regression".
-
Danke für den Tipp, werd ich gleich mal machen. In diesem Wikibook steht übrigens ein etwas ausführlicherer Rechenweg: http://de.wikibooks.org/wiki/Mathematik:_Statistik:_Regressionsanalyse#Minimierung
Allerdings komme ich nicht auf den Regressionskoeffizienten b aus den beiden Gleichungen die darüber stehen. Werds gleich nochmal probieren. Wenn ich das hinbekommen habe, kann ich doch in die erste Formel durch RSS = ∑(yi - (p1*t1 + p2*t2))2 ersetzen und dann analog vorgehen oder? Allerdings rechne wird sich dann ein Gleichungssystem ergeben, wie muss ich dann damit verfahren?
-
Weiter unten steht auch noch was zur multilinearen (oder multiplen) Regression: http://de.wikibooks.org/wiki/Mathematik:_Statistik:_Regressionsanalyse#Multiple_Regression
-
Ja danke, die Lösung mit der pseudoinversen hab ich hier schon gelesen: http://fuzzy.cs.uni-magdeburg.de/books/nnfuzzy/txt/regext.pdf
Werd mir die etwas umfangreichere Erläuterung aber noch zu Gemüte führen, danke.
-
Die Pseudoinverse brauchst du eigentlich nicht. Willst du das ganze numerisch lösen? Dann würde ich dir Cholesky-Zerlegung empfehlen (die Matrix des LGS ist symmetrisch positiv definit) ...
-
Etwas ausführlicher:
Hast du ein überbestimmtes Gleichungssystem mit und , dann kannst du folgendermaßen vorgehen:
Dann hast du das LGS , welches du dann - wie oben schon geschrieben - mit Hilfe der Cholesky-Zerlegung lösen könntest ... Das wäre IMHO der einfachste Weg (wenn du das Verfahren allgemein programmieren willst, für Spezialfälle kann man das aber evtl. auch einfacher lösen).
-
Den Namen kannte ich noch nicht, aber das Verfahren habe ich schonmal gesehen. Da es sich bei mir um einen Spezialfall handelt brauche ich es aber nicht. Das lässt sich so schon gut vereinfachen und wenn ich statt der Inversen die Komplimentäre nehme und erst ganz am Ende durch die entsprechende Determinante teile, habe ich auch ausreichende Genauigkeit.
Vielen Dank für deine Hilfe, Problem gelöst
mfG D1B