?
Hallo
Hier ein Beispiel:
f(x,y)=2x2+y2−xy−7yf(x,y) = 2x^2+y^2-xy-7yf(x,y)=2x2+y2−xy−7y
Dann bekommt man die folgenden partiellen Ableitungen:
∂f(x,y)∂x=4x−y\frac{ \partial f(x,y) }{ \partial x} = 4x-y∂x∂f(x,y)=4x−y
und
∂f(x,y)∂y=2y−x−7\frac{ \partial f(x,y) }{ \partial y} = 2y-x-7∂y∂f(x,y)=2y−x−7
Diese Symbole sind nur ne nützliche Schreibweise ohne tiefere Bedeutung.
Andere Möglichkeiten sind:
∂f(x_1,...,x_n)∂x_i=∂f∂x_i(x_1,...,x_n)=∂∂x_if(x_1,...,x_n)=f_xi\frac{ \partial f(x\_1,...,x\_n) }{ \partial x\_i} = \frac{ \partial f }{ \partial x\_i}(x\_1,...,x\_n) =
\frac{ \partial }{ \partial x\_i}f(x\_1,...,x\_n) = f\_{x_i}∂x_i∂f(x_1,...,x_n)=∂x_i∂f(x_1,...,x_n)=∂x_i∂f(x_1,...,x_n)=f_xi
Der Gradient ist grade der Vektor der partiellen Ableitungen. In diesem Fall also
grad(f(x,y))=(∂f(x,y)∂x,∂f(x,y)∂y)grad( f(x,y)) = ( \frac{ \partial f(x,y) }{ \partial x}, \frac{ \partial f(x,y) }{ \partial y} )grad(f(x,y))=(∂x∂f(x,y),∂y∂f(x,y))
und somit:
grad(f(x,y))=(4x−y,2y−x−7)grad( f(x,y) )= ( 4x-y, 2y-x-7 )grad(f(x,y))=(4x−y,2y−x−7)
Die notwendige Bedingung war
grad(f(x,y))=0grad( f(x,y)) = 0grad(f(x,y))=0
Mit 0 ist hier natürlich der Nullvektor gemeint. Wir Bashar schon schrieb kann man es also als Gleichungssystem auffassen:
4x−y=04x-y = 04x−y=0
2y−x−7=02y-x-7=02y−x−7=0
Die Lösung davon ist
x=1,y=4x=1,
y=4x=1,y=4
Dieser Punkt heißt "kritisch" oder "stationär".
Nochmal ein paar Anmerkungen.
Partielle Ableitungen sind nicht das höherdimensionale Analogon zur Ableitung im eindimensionalen. Dafür gehen zu viele wichtige Eigenschaften verloren. Statt dessen gibt es den Begriff der totalen Ableitung. Für skalarwertige Funktionen mehrerer Parameter (die gewisse Bedingungen erfüllen, was hier vorausgesetzt sei), also Funktionen der Form
f:Rn−>Rf: \mathbb{R}^n -> \mathbb{R}f:Rn−>R
entspricht die totale Ableitung aber gerade ihrem Gradienten. Hier ist ein direkter Zusammenhang zum eindimensionalen. Dort gab es die notwendige Bedingung f'(x)=0, nun haben wir grad f(x)=0.
Die hinreichende Bedingung über die zweite Ableitung (wobei es hier auch allgemeiner geht), wird im Höherdimensionalen etwas komplizierter.
Oben wurde schon die Hesse Matrix erwähnt. Die braucht man jetzt aber erstmal nochwas zu höheren partiellen Ableitungen.
Für zweite partielle Ableitungen schreibt man
\frac{ \partial^2 f }{ \partial x\_i \partial x\_j } }(x\_1,...,x\_n) := \frac{ \partial f }{ \partial x\_i }( \frac{ \partial f }{ \partial x\_j }(x\_1,...,x\_n))
Erst also nach x_j, dann nach x_i partiell Ableiten.
Die Hesse Matrix hat nun folgende Gestallt:
H_f(x_1,...,xn)=(∂2f(x_1,...,x_n)∂x_1∂x_1...∂2f(x_1,...,x_n)∂x_n∂x_1.....∂2f(x_1,...,x_n)∂x_1∂x_n...∂2f(x_1,...,x_n)∂x_n∂x_n)H\_f(x\_1,...,x_n)=
\left( \begin {array}{ccc}
\frac{ \partial^2 f(x\_1,...,x\_n) }{ \partial x\_1 \partial x\_1} & ... & \frac{\partial^2 f(x\_1,...,x\_n) }{ \partial x\_n \partial x\_1} \\
. & ... & . \\
\frac{\partial^2 f(x\_1,...,x\_n) }{ \partial x\_1 \partial x\_n} & ... & \frac{\partial^2 f(x\_1,...,x\_n) }{ \partial x\_n \partial x\_n}
\end {array} \right)H_f(x_1,...,xn)=⎝⎜⎜⎜⎜⎛∂x_1∂x_1∂2f(x_1,...,x_n).∂x_1∂x_n∂2f(x_1,...,x_n).........∂x_n∂x_1∂2f(x_1,...,x_n).∂x_n∂x_n∂2f(x_1,...,x_n)⎠⎟⎟⎟⎟⎞
Für das obige Beispiel ergibt sich eine 2x2 Matrix. Erstmal die partiellen Ableitungen zweiter Ordnung:
∂2f(x,y)∂x∂x=4\frac{ \partial^2 f(x,y) }{ \partial x \partial x} = 4∂x∂x∂2f(x,y)=4
∂2f(x,y)∂y∂x=−1\frac{ \partial^2 f(x,y) }{ \partial y \partial x} = -1∂y∂x∂2f(x,y)=−1
∂2f(x,y)∂x∂y=−1\frac{ \partial^2 f(x,y) }{ \partial x \partial y} = -1∂x∂y∂2f(x,y)=−1
∂2f(x,y)∂y∂y=2\frac{ \partial^2 f(x,y) }{ \partial y \partial y} = 2∂y∂y∂2f(x,y)=2
Damit ist unsere Hesse-Matrix:
Hf(x,y)=(4−1−12)H_f(x,y)=
\left( \begin {array}{cc}
4 & -1 \\
-1 & 2
\end {array} \right)Hf(x,y)=(4−1−12)
Die Einträge sind unabhängig von x und y was aber nur am Beispiel liegt und i.A. nicht so ist.
Für die gefundenen Kritischen Punkte, also (x,y)=(1,4) im Beispiel, testet man ob die Hesse-Matrix H positiv definit ist. Wenn ja hat man ein Minimum.
Ist -H positiv definit hat man ein Maximum.
Da aber wie gesagt H bei uns unabhängig von den Parametern ist, braucht man nichts einzusetzen.
Wie oben gesagt ist die Matrix positiv definit genau dann wenn alle Hauptunterdeterminanten positiv sind.
Also erst die Determinante der Matrix selbst:
∣4−1−12∣=4⋅2−(−1)⋅(−1)=7\left| \begin {array}{cc}
4 & -1 \\
-1 & 2
\end {array} \right|
= 4 \cdot 2 - (-1) \cdot (-1) = 7∣∣∣∣4−1−12∣∣∣∣=4⋅2−(−1)⋅(−1)=7
Hauptunterdeterminanten sind die Determinanten der "Teilmatrizen oben links", die man aus der Hesse Matrix "rausschneidet". Erst die ganze Matrix, dann die bei der lediglich die letzte Zeile und letzte Spalte weggenommen wurde und so weiter.
Im Beispiel bleibt also nur noch die 1x1 Matrix oben links, also genau die Zahl 4. Die ist natürlich positiv.
Also ist das hinreichende Kriterium erfüllt und (1,4) ist ein Minimun.
Falls du nicht mit den Begriffen Matrix und Determinante vertraut bist, findest du im Netz sicher einiges dazu. Man braucht nicht viel drüber zu wissen um es in diesem Kontext anwenden zu können.
Noch eine Kleinigkeit: Die totale Ableitung eines Gradienten ist grade die Hesse Matrix. Man kann es also als zweite Ableitung auffassen und es ist wieder dem eindimensionalen Fall sehr ähnlich. Da die zweite Ableitung aber eine Matrix ist, hat man die Begriffe positiv definit und negativ definit. Also alles nur verallgemeinert
Gruß, space