LMS-Algorithmus in simplen Spielen



  • Hi! Folgendes: Wir haben die Aufgabe bekommen den LMS-Algorithmus für ein Tic-Tac-Toe spiel anzuwenden, allerdings eins mit 5x5x5 Feldern.

    Mir sind allerdings schon die Grundlagen unverständlich.
    So wie ich es verstanden habe soll eine approximierte Zielfunktion gelernt werden, in der die Gewichte angepasst werden.
    Angenommen wir haben also eine Zielfunktion V'(x)=w1x1+w2x2+23x3+w4x4+w5x5+w6x6

    wie bestimme ich denn dann welchen zug ich mache? Angenommen ich habe jetzt fertig gelernt. Angenommen wir reden z.B. nur von einem 3x3 Tic Tac Toe spiel wie können wir daraus schließen welchen Zug der gelernte Spieler macht?

    am Ende ist V'(x) doch nur ne zahl, wenn man alles einsetzt. Darum versteh ich partout nicht wo man daraus einen Zug ablesen kann. Ich versteh es bei garkeinem Beispiel.
    Ich wäre höchst dankbar für irgendein Beispiel wo das mal angewendet wird und man auch sieht wie er seinen Zug macht.


Anmelden zum Antworten