Münzen

Ponto

borg schrieb:

bedarf besteht:

Ok: Zu Beginn des Spiels und solange nur Zahl geworfen wird, ist alles egal, da für beide Spieler keine Sequenz beginnt, die zum Erfolg führen kann. Sobald aber zum ersten mal Kopf geworfen wird, muss man überlegen. Nach dem ersten Kopf folgt mit 50% Wahrscheinlichkeit wieder Kopf. Nach zwei Kopf Würfen gewinnt aber immer Spieler B, da irgendwann eine Zahl kommt. Damit gewinnt B an dieser Stelle bereits mit 50%. Kommt eine Zahl geht es jedoch weiter.

Wir haben an dieser Stelle eine Folge von Würfen, die nicht interessieren, dann Kopf und dann Zahl. Im folgenden Wurf kann mit 50% Kopf geworfen werden. Dann gewinnt Spieler A. Ausgehend vom ersten Kopf Wurf geschieht dies in 25% der Fälle. In den restlichen 25% wird nach dem ersten Kopf zweimal Zahl geworfen. Nach zwei Zahl Würfen beginnt jedoch das ganze Spiel von vorne und alles ist am Ausgangspunkt. Damit kann man die Wahrscheinlichkeit PB für den Gewinn von B ausrechnen:

PB = 0.5 + 0.25PB

Der erste Summand spiegelt die 50% des sicheren Gewinns nach zweimal Kopf und der zweite Summand steht für das ganze Spiel von vorne, was in 25% der Fälle auftritt.

Für A gilt analog:

PA = 0.25 + 0.25PA

Beide Gleichungen kann man einfach auflösen, so dass PB = 2/3 und PA = 1/3 gilt.

borg

kann mir einer sagen wie die fragestellung lauten müsste für das was ich programmiert hab?

ich seh nicht wo es abweicht.

Es werden 3 Münzen geworfen, bei Kombination x gewinnt A, bei y B. Bei einer anderen Kombination wird neu geworfen.

Bye, TGGC

Jester

Man kann sich denke ich leicht einen Automaten aufstellen, der sozusagen zufällig zwischen Zuständen hin- und herwandert. Dann kann man zählen, wer mehr Terminalzustände hat: 1. oder 2. Spieler. So kann man es sich graphisch wohl recht gut veranschaulichen.

borg

TGGC|_work schrieb:

Es werden 3 Münzen geworfen, bei Kombination x gewinnt A, bei y B. Bei einer anderen Kombination wird neu geworfen.

Bye, TGGC

ich werfe aber immer nur eine münze neu.

D1BAKEL

@borg: um das richtige Gewinnverhältnis zu erhalten, musst du die for-Schleife drei zeilen früher beginnen... (die zuweisungen am anfang müssen in der schleife stehen) sobald der eine gewonnen hat (der mit 2/3) hat der andere ne 50%ige Chance zu gewinnen, wenn die letzten beiden würfe ins neue experiment mitübernommen werden...

mfG D1B

Sorry, hab die letzte Anwort (bzw. Frage) total verpeilt. Richtig wäre:

Wirf eine Münze n-mal, für jedes Auftreten der Kombination x bekommt A einen Punkt, für jedes y bekommt B einen Punkt.

(Dein Programm fängt nicht an neu zu werfen, sondern benutzt die letzten beiden Würfe, mit denen jemand gewinnt als Anfang für die neue Serie)

Bye, TGGC

borg

doppelpost

borg

TGGC|_work schrieb:

(Dein Programm fängt nicht an neu zu werfen, sondern benutzt die letzten beiden Würfe, mit denen jemand gewinnt als Anfang für die neue Serie)

danke, hab ich verpeilt.

Ich habe mal versucht, dass ganze als Diffusionsmodell zu implementieren. (Sollten Fehler enthalten sein, würde ich mich über entsprechende Hinweise freuen. Ich bin gerade erst dabei, mich in die Thematik einzuarbeiten. *shy*)

Hier der MatLab-Code:

function coin()
%  A perfect coin is tossed until A or B wins: 
%  A wins if H T H (head tail head)
%  B wins if H H T (head head tail)
%
% states:  H     T     HH    HT    TH    TT    HHH   HTT   THH   THT   TTH   TTT   HTH   HHT         
% 3 transient classes:
%	 H     T
%   HH    HT    TH    TT
% and
%   HHH   HTT   THH   THT   TTH   TTT
%
% 2 recurrent and absorbing states
% HTH
% HHT

% transition probability matrix:
P = [...                                                                                    
% H     T     HH    HT    TH    TT    HHH   HTT   THH   THT   TTH   TTT   HTH   HHT         
  0     0     0.5   0.5   0     0     0     0     0     0     0     0     0     0           
  0     0     0     0     0.5   0.5   0     0     0     0     0     0     0     0           
  0     0     0     0     0     0     0.5   0     0     0     0     0     0     0.5         
  0     0     0     0     0     0     0     0.5   0     0     0     0     0.5   0           
  0     0     0     0     0     0     0     0     0.5   0.5   0     0     0     0           
  0     0     0     0     0     0     0     0     0     0     0.5   0.5   0     0           
  0     0     0     0     0     0     0.5   0     0     0     0     0     0     0.5         
  0     0     0     0     0     0     0     0     0     0     0.5   0.5   0     0           
  0     0     0     0     0     0     0.5   0     0     0     0     0     0     0.5         
  0     0     0     0     0     0     0     0.5   0     0     0     0     0.5   0           
  0     0     0     0     0     0     0     0     0.5   0.5   0     0     0     0           
  0     0     0     0     0     0     0     0     0     0     0.5   0.5   0     0           
  0     0     0     0     0     0     0     0     0     0     0     0     1     0           
  0     0     0     0     0     0     0     0     0     0     0     0     0     1    ];     
% initial distribution = distribution after one toss
Z = [...
  0.5   0.5   0     0     0     0     0     0     0     0     0     0     0     0];

% distribution after 2 tosses
twoTosses = Z * P

% distribution after 3 tosses
threeTosses = Z * P^2

% distribution after 1000 tosses,  equals  bounding probability
boundingProbability = Z * P^1000

Die Ausgabe sieht dann so aus:

twoTosses = 
         0         0    0.2500    0.2500    0.2500    0.2500         0		0         0         0         0         0         0         0

threeTosses =
         0         0         0         0         0         0    0.1250    0.1250    0.1250    0.1250    0.1250    0.1250    0.1250    0.1250

boundingProbability =
         0         0         0         0         0         0    0.0000    0.0000    0.0000    0.0000    0.0000    0.0000    [b]0.3333[/b]    [b]0.6667[/b]

Hier sieht es also auch so aus, dass mit 66%iger Wahrscheinlichkeit B gewinnt.

Für eine geschlossene Lösung habe ich dann obigen Code noch um folgende Zeilen ergänzt:

% closed solution

% decomposition of transition matrix P
% transition matrix Q for transient states
Q = P(1:12,1:12);
% transition matrix R for recurrent states
R = P(1:12,13:14)

% initial distribution
Z2 = Z(1:12); 

% identity matrix size of Q
I = eye(12,12);

% Probability of ending in state HTH vs. HHT
prob = Z2 * (I-Q)^-1 * R;

% mean number of tosses until player wins HTH vs. HHT
tosses = (Z2 * inv(I-Q) * inv(I-Q)* R)./ prob

Diese Ergänzungen erzeugten folgende Ausgabe:

prob =

    0.3333    0.6667

tosses =

    4.3333    5.3333

Die Wahrscheinlichkeiten sind also genauso wie im genäherten Fall: in 66% der Fälle gewinnt B. Allerdings war die mittlere Anzahl an Würfen bis zum Sieg etwas überraschend: Obwohl Spieler A nur in 33% aller Fälle gewinnt, braucht er in diesen Fällen nur ca. 4 Würfe.

Nein das ist überhaupt nicht verblüffend, denn in den langen Serien, die mit A's Kombination enden, hat B ja schon vorher gewonnen.

Bye, TGGC

dooya

TGGC|_work schrieb:

Nein das ist überhaupt nicht verblüffend, denn in den langen Serien, die mit A's Kombination enden, hat B ja schon vorher gewonnen.

Bye, TGGC

Nein, in diesem Modell endet jede Serie sobald einer der beiden Spieler gewonnen hat, danach wird neu gestartet. Es kann also in einem trial nur A oder B gewinnen.

Ja und? Darum hat A ja grad wenige lange Gewinnserien.

Bye, TGGC

dooya

TGGC|_work schrieb:

Ja und? Darum hat A ja grad wenige lange Gewinnserien.

Bye, TGGC

Von "Gewinnserien" war bislang nicht die Rede.

Die 4.33 bedeutet nicht, dass A durchschnittlich 4.33 mal hintereinander gewinnt, sondern, dass in den Fällen in denen A gewinnt die Münze im Mittel 4.33 mal geworfen wurde, während wenn B gewinnt im Schnitt 5.33 mal geworfen wurde.

Bei oberflächlicher Betrachtung erscheint es also so, als ob A früher gewinnt, obwohl er aber seltener gewinnt. Das empfand ich als kontra-intuitiv.

Allerdings kann ein Vergleich der Verteilungen der mittleren Wurfanzahl von A und B diesen Irrtum recht schnell aufklären, denn für jede Wurfanzahl ist P(A) ≤ P(B).

dooya schrieb:

TGGC|_work schrieb:

Ja und? Darum hat A ja grad wenige lange Gewinnserien.

Von "Gewinnserien" war bislang nicht die Rede.

Gewinnserie == Serie von Münzwürfen, die zum Sieg führt. Um mit den ersten drei Würfen zu gewinnen, ist die Chance ja für beide Spieler gleich. B gewinnt dennoch öfter, also gewinnt er die meisten der längeren Serien.

Bye, TGGC

dooya

TGGC|_work schrieb:

dooya schrieb:

TGGC|_work schrieb:

Ja und? Darum hat A ja grad wenige lange Gewinnserien.

Von "Gewinnserien" war bislang nicht die Rede.

Gewinnserie == Serie von Münzwürfen, die zum Sieg führt. Um mit den ersten drei Würfen zu gewinnen, ist die Chance ja für beide Spieler gleich. B gewinnt dennoch öfter, also gewinnt er die meisten der längeren Serien.

Bye, TGGC

Ja, nun habe auch ich verstanden, was ihr meintet. Ihr habt natürlich Recht.