Bonusterne berechnen in Hearthstone

Bengo

Ok ich hab jetzt eine expliziete Formel für den Erwartungswert, wer ein bischen mehr Ahnung von Mathe hat, kann die bestimmt auch so verbessern, dass man sie tatsächlich einfach ausrechnen kann:
P =

$\begin{pmatrix} 0,5 & 0,5 & 0 & 0 \\ 0,5 & 0 & 0,5 & 0 \\ 0,5 & 0 & 0 & 0,5 \\ 0,5 & 0 & 0 & 0,5 \\ \end{pmatrix}$

E = Vector(-1, 1 , 1, 2) * (Vector(0,5;0,5;0;0)*P^(g))

Bengo schrieb:

Ich sehe da eigentlich nur eine ganz normale Bernullikette.

Die Folge von Siegen und Niederlagen ist eine Bernoulliekette, da wir aber insbesondere an Serien oder "Glücksträhnen" interessiert sind kommt man nicht um die Markovkette rum, weil wir vorherige Ereignisse mit betrachten müssen. So hab ich das zumindest verstanden.

Die Matrix verstehe ich nicht... kannst du das erläutern? Ich hätte 3 Zustände erwartet (-1,+1,+2) oder aber etwas in die Richtung $g$ mal irgendwas Zustände (für alle möglichen Zustände bei $g$ spielen).

Ich lese mich grad in Markovketten ein. Jemand einen guten Link parat, mit ausführlicher Einführung und umfangreicher Erklärung?

Das Problem hier scheint eine Kombination aus "Irrfahrt auf Z" und "Warteschlange" zu sein, die beiden Beispiele tauchen in vielen möglichen Markov-Skripts auf.

SG1

Dudeldu schrieb:

Ich hätte 3 Zustände erwartet (-1,+1,+2)

Das sind keine Zustände. Zustände in diesem Fall sind:

Letztes Spiel verloren
1 Spiel in Folge gewonnen
2 Spiele in Folge gewonnen
3 oder mehr Spiele in Folge gewonnen.

SeppJ

Dudeldu schrieb:

Die Matrix verstehe ich nicht... kannst du das erläutern? Ich hätte 3 Zustände erwartet (-1,+1,+2) oder aber etwas in die Richtung $g$ mal irgendwas Zustände (für alle möglichen Zustände bei $g$ spielen).

Die vier Zustände sind: Niederlage; 1. Sieg; 2. Sieg; und dritter oder mehr Siege.

Bengo schrieb:

Ok ich hab jetzt eine expliziete Formel für den Erwartungswert, wer ein bischen mehr Ahnung von Mathe hat, kann die bestimmt auch so verbessern, dass man sie tatsächlich einfach ausrechnen kann:
P =

$\begin{pmatrix} 0,5 & 0,5 & 0 & 0 \\ 0,5 & 0 & 0,5 & 0 \\ 0,5 & 0 & 0 & 0,5 \\ 0,5 & 0 & 0 & 0,5 \\ \end{pmatrix}$

E = Vector(-1, 1 , 1, 2) * (Vector(0,5;0,5;0;0)*P^(g))

Wenn p die Gewinnwahrscheinlichkeit darstellt, dann ist somit der Erwartungswert für die Anzahl der Sterne (pro Spiel!):
Bei einem oder zwei Spielen: -1+2p
Bei drei oder mehr Spielen: -1+2p+p^3
Es reicht also eine durchschnittliche Gewinnwahrscheinlichkeit von p > ~0.453, um unendlich viele Sterne anhäufen zu können.

Ist mir jetzt schon peinlich, das nicht gesehen zu haben, dabei hab ich das doch studiert :p . Ich habe mich so sehr in den kombinatorischen Ansatz versteift, dass ich die einfache Lösung gar nicht gesehen habe.

Ah, leuchtet schon mehr ein.

Komme dann auf eine 5x5 Matrix

$M=\begin{pmatrix} & O & L & W & WW& WWW\\ O & 0 & 0 & 0 & 0 & 0\\ L & 0,5 & 0,5 & 0,5 & 0,5 & 0,5 \\ W & 0,5 & 0,5 & 0 & 0 & 0\\ WW & 0 & 0 & 0,5 & 0 & 0\\ WWW & 0 & 0 & 0 & 0,5 & 0,5\\ \end{pmatrix}$

Mit dieser Visualiserung. Denke den Anfangszustand O kann man weglassen, dann komme ich auf dieselbe Matrix wie Bengo, nur Transponiert...
Dann muss man ja nur noch herausfinden wie oft ein bestimmter Zustand nach $g$ Schritten besucht wurde :).

Oh, da hast du schneller gepostet, bezog mich auf SG1. Dann ist das Problem ja gelöst :D. Analytisch! Wunderbar!

SeppJ

Dudeldu schrieb:

Denke den Anfangszustand O kann man weglassen

So ist es. solltest du sogar. Der Anfangszustand ist in bengos Gleichung das (0.5, 0.5, 0, 0) (oder allgemeiner: (1-p, p, 0, 0)), das heißt, das erste Spiel gewinnt man mit einer Wahrscheinlichkeit von 0.5 (bzw p) oder verliert es mit W'keit 0.5 (bzw. p-1).

Dann muss man ja nur noch herausfinden wie oft ein bestimmter Zustand nach $g$ Schritten besucht wurde :).

Eben indem du die Matrix g-mal (beziehungsweise g-1 Mal, wenn du das erste Spiel weg lässt) mit sich selber multiplizierst. Und da kommt nach drei Schritten ein statisches Ergebnis bei heraus.

Sehr cool das Ganze. Mit dem einfachen System hat Blizzard direkt zwei Fliegen mit einer Klappe geschlagen. "Schlechte" Spieler machen dennoch Fortschritt und verlieren nicht den Spass am Spielen und "Gute" Spieler werden mit dritter Potenz durch das Bonussystem Belohnt und machen dementsprechend sehr schnell Sprünge nach vorn.

Danke an alle die hier mitgeholfen haben :). Hat Spass gemacht die Lösung nach und nach zu erarbeiten (naja, "erhalten" trifft es wohl eher ).

SeppJ

Dudeldu schrieb:

"Gute" Spieler werden mit dritter Potenz durch das Bonussystem Belohnt und machen dementsprechend sehr schnell Sprünge nach vorn.

Denk dran, dass das Maximum immer noch 2 ist, selbst bei 100% Gewinnrate

Bengo

Dudeldu schrieb:

Sehr cool das Ganze. Mit dem einfachen System hat Blizzard direkt zwei Fliegen mit einer Klappe geschlagen. "Schlechte" Spieler machen dennoch Fortschritt und verlieren nicht den Spass am Spielen und "Gute" Spieler werden mit dritter Potenz durch das Bonussystem Belohnt und machen dementsprechend sehr schnell Sprünge nach vorn.

Danke an alle die hier mitgeholfen haben :). Hat Spass gemacht die Lösung nach und nach zu erarbeiten (naja, "erhalten" trifft es wohl eher ).

Es ist die dritte Potenz einer Matrix, ich glaube das wirkt sich anders aus als bei reelen Zahlen größer 1. Dazu ist jeder eintrag der Matrix auch noch kleiner gleich 1.

Ich hab von linearer Algebra leider nicht so viel Ahnung, wie ich gerne hätte, deshalb noch 2 Fragen. Macht es eigentlich einen unterschied, wenn man die Matrix transponiert? und gibt es irgentwelche einfachen wege um eine matrix zu potenzieren?

Jester

Bengo schrieb:

Ich hab von linearer Algebra leider nicht so viel Ahnung, wie ich gerne hätte, deshalb noch 2 Fragen. Macht es eigentlich einen unterschied, wenn man die Matrix transponiert? und gibt es irgentwelche einfachen wege um eine matrix zu potenzieren?

Wenn Du dafür auch die Vektoren transponierst und von der anderen Seite dran multiplizierst macht das keinen Unterschied. Ein einfacher Check ist, ob eine Wahrscheinlichkeitsverteilung auch wieder auf eine solche abgebildet wird. Zum Potenzieren ist es hier halt so, dass sich schon nach kurzer Zeit nichts mehr tut. Das ist ja auch nicht verwunderlich, schließlich hat man sehr wenige Zustände und schon nach kurzer Zeit ist es fast egal wo man angefangen hat, da immer wenn man einmal verliert man ja wieder an derselben Stelle ist, egal was vorher passiert ist.

Will man eine Matrix allgemein potenzieren bietet sich natürlich klassisches square&multiply an, also $A^{2b} = (A^2)^b$ nutzen, und bei $A^{2b+1} = A^{2b} \cdot A$ nutzen. Das nützt natürlich nur am Rechner was.

Ansonsten kann man natürlich auch versuchen eine geeignete Zerlegung zu finden. Wenn eine Matrix zum Beispiel diagonalisierbar ist, dann lässt sie sich schreiben als $A = S^{-1} D S$ , und damit ist $A^n = S^{-1} D^n S$ . Die Diagonalmatrix D lässt sich leicht potenzieren. Im Zweifelsfall kann man sich hier bestimmt auch mit einer Jordan-Normalform behelfen, das ist sicher besser als nichts. Das wird wohl nicht immer zum Ziel führen, aber ich denke damit kriegt man schon einiges in den Griff.

Jester

Kenner der algebraische G schrieb:

Gelesen: "Bonusterne berechnen in Hartshorne"

Das ist mir übrigens auch passiert.

Die Kurven $2*x-1$ und $x^3$ schneiden sich 2 mal im Intervall [0;1], bei $x_1=\frac{1}{2}*(\sqrt{5}-1) \approx 0.618$ und $x_2=1$ . Hab nun versucht das zu interpretieren. Das bedeutet doch, dass man "optimal" spielt wenn man mit einer Winrate von $x_{1,2}$ spielt, da man dort die meisten Sterne für die investierte Zeit erhält, nicht wahr?
Oder auch anders ausgedrückt bei einer Winrate über $\approx 0.618$ ist der Fleißfaktor größer als der Skillfaktor.

Jester

Das Argument verstehe ich nicht. Das ist ja die Anzahl der Sterne pro Spiel. Je höher die Winrate, desto höher die Sterne pro Spiel, ergo: mehr spielen -> mehr Sterne. Fleiß gewinnt also auf jeden Fall. Allerdings wächst der Anteil eben nicht linear mit der Winrate, sondern anfangs etwas schneller und später etwas langsamer.

C14

Hier noch eine Alternativlösung ohne Markov-Kette:
Sei $x_i$ die ZV für das Resultat im i-ten Spiel mit win = 1, loss = 0 und E[x_i] =: p
Dann ist die Anzahl der Sterne nach n >= 3 Spielen
$s = \sum_{i=1}^n (2 x\_i - 1) + \sum\_{i=3}^n x\_i x\_{i-1} x_{i-2}$
Dann ist mit Linearität des Erwartungswert und Produkt von Erwartungswerten von unabhängigen ZVn:
E[s] = n \cdot (2p-1) + (n-2) \cdot p^3

volkard

Dudeldu schrieb:

bei $x_1=\frac{1}{2}*(\sqrt{5}-1) \approx 0.618$

Welch überraschendes Auftauchen des https://de.wikipedia.org/wiki/Goldener_Schnitt