Rechnung gibt falsches Ergebnis.



  • @Finnegan sagte in Rechnung gibt falsches Ergebnis.:

    Ja, das ist aber eine "andere Berechnung" ich rede hier von "exakt der selben Berechnung" in (486 - pow(3, 5)) == (486 - pow(3, 5)). Die rechte und die linke Seite von == werden bei deinem Argument entweder beide in 80-Bit oder beide in IEEE durchgeführt. Der Vergleich muss also immer true liefern. Tut er aber nicht bei MinGW.org.

    Nein, so etwas kann man bei Floats leider nicht aussagen. Es gibt etliche Faktoren, die das Ergebnis einer Float Berechnung verändern können, und solange man nicht explizit das IEEE Normverhalten aktiviert hat, kann der Compiler einen ziemlichen Unfug treiben. D.h. exakt die gleichen Rechnungen müssen explizit nicht das Gleiche ergeben – sie können. Lies Dir dazu die Doku von Intel, die IEEE Norm und das Compilerhandbuch durch.



  • @john-0 sagte in Rechnung gibt falsches Ergebnis.:

    [...] D.h. exakt die gleichen Rechnungen müssen explizit nicht das Gleiche ergeben – sie können. Lies Dir dazu die Doku von Intel, die IEEE Norm und das Compilerhandbuch durch.

    Auf verschiedenen CPUs, Betriebssystemen oder auch mit anderen Compiler-Flags gebe ich dir da ohne Widerspruch recht. Diese Probleme sind mir bekannt, wodurch man selbst auf AMD- und Intel-x86 mit IEEE-Floats auf standardkonforme Weise leicht unterschiedliche Ergebnisse erhalten kann.

    Wir reden hier aber von zwei identischen Berechnungen auf der selben CPU, mit den selben Compiler-Flags auf dem selben OS im selben Programm, ja sogar im selben Ausdruck. Ich kenne die Normen nicht auswendig, aber ich habe starke Zweifel, dass sich speziell dieses Szenario mit den Freiheiten die diese einer Implementation lassen erklären lässt.

    Meines wissens sind Float-Berechnungen schon deterministisch, aber eben nicht sonderlich portabel.


  • Mod

    Wieso ist das so überraschend für dich? Angenommen das Szenario mit dem 80Bit/64Bit Rechenwerk. Dann ist eine ganz valide Interpretation des Codes folgende Arbeitsanweisung (die auch sehr wahrscheinlich bei O0 genommen wird):

    1. Berechne die linke Seite (80 Bit Präzision)
    2. Speichere das Ergebnis irgendwo (wird zu 64 Bit gerundet), denn wir brauchen Platz im Rechenwerk für die nächste Rechnung
    3. Berechne die rechte Seite (80 Bit Präzision)
    4. Oh, nun soll ich die beiden Werte vergleichen! Der 2. Wert steht ja noch im Rechenwerk (80 Bit), nun muss ich nur noch den 1. Wert wieder in das andere Register vom Rechenwerk laden.
    5. Jetzt wird der 80 Bit-Wert mit dem gerundeten 64-Bit-Wert verglichen.
    6. -> false




  • @SeppJ sagte in Rechnung gibt falsches Ergebnis.:

    Wieso ist das so überraschend für dich?

    Danke für die Aufklärung. Das ist in der Tat überraschend für mich, dass hier verglichen wird, ohne vorher sicherzustellen, dass der zweite Wert ebenfalls gerundet wird.

    Ich habe mich bisher tatsächlich darauf verlassen, dass ich das exakt selbe Ergebnis erhalte, wenn ich identische Rechenanweisungen in meinem Code durchführe. Egal wie die interne Repräsentation in den CPU-Registern aussieht und wie viele Rundungsfehler meine Berechnungen einbringen.

    Ich bin sogar entsetzt, wenn das wirklich alles so Standardkonform sein sollte. Das heisst wenn ich mich darauf verlassen muss, das zwei indentische FP-Berechnugen zum bitgenau selben Ergebnis kommen, verwende ich besser eine wohldefinierte FP-Emulation via Integer - auch wenn ich dasselbe Ergebnis im selben Programm mit exakt den selben Compiler-Flags und ordentlich initialisierter FPU benötige?

    Edit: Oder eben dem Compiler verklickern, solche Spässe zu unterlassen: -ffloat-store sorgt hier tatsächlich dafür, dass auch MinGW.org true ausgibt. Danke für den SO-Link!



  • @Finnegan sagte in Rechnung gibt falsches Ergebnis.:

    Meines wissens sind Float-Berechnungen schon deterministisch, aber eben nicht sonderlich portabel.

    Das ist nur dann garantiert, wenn man explizit das IEEE Normverhalten durch den Compiler aktiviert, und einen Rattenschwanz an Nebenbedingungen einhält. Das wird schon problematisch, wenn ein Autovektorisierer am Werk ist, und wird richtig problematisch, wenn Threading im Spiel ist. Denn die Reihenfolge von Additionen oder Multiplikationen spielt bei der Reproduzierbarkeit der Ergebnisse eine nicht unwesentliche Rolle. Da es so etwas wie out-of-order execution gibt, kann das auch eine Rolle spielen. Was genau der Compiler hier treibt ist unklar, die Masse wird hier true zurückliefern, wie man das erwartet.



  • @john-0 sagte in Rechnung gibt falsches Ergebnis.:

    @Finnegan sagte in Rechnung gibt falsches Ergebnis.:

    Meines wissens sind Float-Berechnungen schon deterministisch, aber eben nicht sonderlich portabel.

    Das ist nur dann garantiert, wenn man explizit das IEEE Normverhalten durch den Compiler aktiviert, [...]

    Jo danke, wieder was dazugelernt. Das mit der 80bit-Repräsentation und IEEE waren mir zwar bekannt, aber ich dachte bisher tatsächlich, dass sich das nur auswirkt, wenn man zwei mit unterschiedlichen Compiler-Flags gebaute Programme hat, oder sogar andere CPUs/Architekturen. Separate Threads hätte ich auch noch verstanden, wenn sie auf verschiedenen Kernen laufen. Aber im selben Ausdruck finde ich schon erschreckend 😉

    Nicht leicht, wenn man z.B. bei einer komplexeren physikalischen Simulation mit identischen Eingabewerten exakt den selben Endzustand reproduzieren will.



  • @Finnegan sagte in Rechnung gibt falsches Ergebnis.:

    Edit: Oder eben dem Compiler verklickern, solche Spässe zu unterlassen: -ffloat-store sorgt hier tatsächlich dafür, dass auch MinGW.org true ausgibt. Danke für den SO-Link!

    Exakt das 80Bit vs. 64Bit Problem und die Erklärung von SeppJ traf ins Schwarze.



  • @john-0 sagte in Rechnung gibt falsches Ergebnis.:

    Exakt das 80Bit vs. 64Bit Problem und die Erklärung von SeppJ traf ins Schwarze.

    Sieht so aus. Ich werd erstmal den Abend mit Kopfschütteln verbringen. Da bei mir grad ein Teil meines Weltbildes kaputtgegangen. Zum Glück habe ich noch keine Programme geschrieben, die wegen sowas spontan explodieren können 😉


  • Mod

    Sieh es mal so: Floating-Point ist quasi gemacht, um im Computer so etwas wie ein Zahlenkontinuum zu haben. Typische Nutzer dafür sind physikalische und ingenierustechnische Berechnungen, und ähnliches. Aber eben nicht Zahlentheoretiker, Bankkaufleute, etc. Die sind mit ganzen Zahlen schon perfekt bedient. Für die vorgesehenen Benutzer ist absolute Gleichheit praktisch nie entscheidend. Das sind alles stetige, hinreichend gutartige Funktionen. Es geht schlimmstenfalls um Differenzen, und die Größenordnung derselben. Und die Größenordnung der Differenz ist hier korrekt ziemlich nahe bei 0.



  • @SeppJ sagte in Rechnung gibt falsches Ergebnis.:

    [...] Für die vorgesehenen Benutzer ist absolute Gleichheit praktisch nie entscheidend. Das sind alles stetige, hinreichend gutartige Funktionen.

    Es geht mir auch weniger um Gleicheit, als um Reproduzierbarkeit. Ich hatte die Problematik ja schonmal angesprochen für ein Netzwerkspiel lediglich User-Eigaben übers Netzwerk zu übertragen und die Spielwelt in einer Lockstep-Simulation auf allen Clients synchron zu halten. Das spart eine Menge Traffic und skaliert gut. Das ist wohl eine ziemliche Herausforderung, sowas zuverlässig hinzubekommen, so dass auch die Performance stimmt.

    Es stimmt aber, dass das wohl ein etwas exotischeres Problem ist. Hier schlagen diese Rundungsgeschichten aber voll durch. Aber auch für Physiker und Ingenieure wäre es sicher nicht verkehrt, wenn länger laufende identische Simulationen im selben Endzustand landen.


  • Mod

    Für nicht-chaotische Systeme laufen sie ja auch in den (effektiv) gleichen Zustand, trotz minimaler Rundungsfehler, das ist ja gerade mein Punkt. Für chaotische Systeme natürlich nicht. Aber in dem Fall ist das schon fast ein Feature, weil es gewissermaßen der Realität entspricht 😃

    Das sollte für das Netzwerkspiel genauso gelten, das ist ja quasi eine Physiksimulation. Wenn da in der 14. Nachkommastelle was nicht exakt ist, dann macht das den millionsten Teil von einem Pixel. 64 Bit Präzision sind wahnsinnig exakt, wenn man mal darüber nachdenkt. Viel genauer als selbst die genauesten Messungen von egal was in der Realität. Daher reicht für so etwas wie Computergrafik auch 32 Bit in der Renderpipeline auch ganz locker aus. Da bekommst du viel eher und viel größere Fehler als durch deine durch double-Rundungsfehler verursachte Gamephysikungenauigkeit.



  • @SeppJ sagte in Rechnung gibt falsches Ergebnis.:

    Für nicht-chaotische Systeme laufen sie ja auch in den (effektiv) gleichen Zustand, trotz minimaler Rundungsfehler, das ist ja gerade mein Punkt. Für chaotische Systeme natürlich nicht. Aber in dem Fall ist das schon fast ein Feature, weil es gewissermaßen der Realität entspricht 😃

    Ja, und jeder trägt seine eigene Realität in seinem Kopf spazieren. Das ist zwar auch wie in der physischen Welt, für ein Spiel aber dennoch nicht optimal - besonders wenn man glaubwürdig darstellen will, wer den jetzt getroffen und wer daneben geschossen hat. Oder wenn man entscheiden will, welcher Cheater jetzt gekickt werden soll, weil er seine Simulation manipuliert hat (auch ein wichtiger Punkt), da sind bit-identsiche Spielzustände nützlich.

    Das sollte für das Netzwerkspiel genauso gelten, das ist ja quasi eine Physiksimulation. Wenn da in der 14. Nachkommastelle was nicht exakt ist, dann macht das den millionsten Teil von einem Pixel.

    Kommt auch drauf an wie gross die Welt ist. Für den "Screen Space" (nach Transformation der Weltobjekte in diesen) mag das zutreffen, aber die Simulationen in Weltkoordinaten der Spielwelt können sich schonmal über ein paar Kilometer erstrecken - je nachdem um was für ein Spiel es sich handelt.

    Für grosse Welten wird man dann aber wohl auch verschiedene hierarchische Koordinatensysteme haben. Denke nicht das so ein aktueller MS Flugsimulator für die gesamte Erde mit einem einzigen double-basierten Koordinatensystem arbeitet.

    Ich habe jedenfalls schon Rundungsfehler debuggt, wo das Objekt in der Welt mehrere Meter neben seiner korrekten Position gerendert wurde. Da meinte aber auch ein Entwickler, alle Transformationen fürs Rendering in Weltkoodinaten durchführen zu müssen - 10.000km vom Weltursprung entfernt 😉

    64 Bit Präzision sind wahnsinnig exakt, wenn man mal darüber nachdenkt. Viel genauer als selbst die genauesten Messungen von egal was in der Realität. Daher reicht für so etwas wie Computergrafik auch 32 Bit in der Renderpipeline auch ganz locker aus. Da bekommst du viel eher und viel größere Fehler als durch deine durch double-Rundungsfehler verursachte Gamephysikungenauigkeit.

    Ich bin mir gar nicht so sicher, ob diese Fehler dazu führen, dass das ganze System immer weiter divergiert, oder ob sich die Fehler über die Zeit alle ausgleichen. Denke auch diese 80/64-Bit-Geschichte lässt sich ebenfalls mit numerisch stabilen Algorithmen in den Griff bekommen, wie auch die durch sonstige FP-Arithmetik ohnehin schon verursachten Fehler - die muss man sowieso schon berücksichtigen.


  • Mod

    @Finnegan sagte in Rechnung gibt falsches Ergebnis.:

    Für grosse Welten wird man dann aber wohl auch verschiedene hierarchische Koordinatensysteme haben. Denke nicht das so ein aktueller MS Flugsimulator für die gesamte Erde mit einem einzigen double-basierten Koordinatensystem arbeitet.

    Doch! Das sage ich doch gerade, dass 64-Bit Werte dumm genau sind. Selbst mit dem etwas ungünstigen Grad-System wäre die Auflösung in 2^64- Werte von der Schrittweite her im Bereich 1 Picometer!

    Bei dem Flugsimulator machen floating-points für die Koordinaten aber wenig Sinn, da es bei floating-Point darum geht, dass man 1.3574e-24 und 5.226e163 mit dem gleichen Datentyp darstellen kann. Das ist für Koordinaten auf der Erde nicht relevant, da würde man einen integerartigen Koordinatentyp wählen. Und selbst 32 Bit geben dir immer noch Zentimeterauflösung.



  • @SeppJ sagte in Rechnung gibt falsches Ergebnis.:

    @Finnegan sagte in Rechnung gibt falsches Ergebnis.:

    Für grosse Welten wird man dann aber wohl auch verschiedene hierarchische Koordinatensysteme haben. Denke nicht das so ein aktueller MS Flugsimulator für die gesamte Erde mit einem einzigen double-basierten Koordinatensystem arbeitet.

    Doch! Das sage ich doch gerade, dass 64-Bit Werte dumm genau sind. Selbst mit dem etwas ungünstigen Grad-System wäre die Auflösung in 2^64- Werte von der Schrittweite her im Bereich 1 Picometer!

    Ja, das muss man sich echt immer wieder mal ausrechnen, um sich dessen bewusst zu werden. Gebe dir recht. Da braucht man echt erst ein übergelagertes zweites Koordinatensystem, wenn die Welt grösser als ein Planet werden soll - oder man Objekte auf Atomgrösse braucht.

    Dabei hab ich selbst schonmal argumentiert, dass man bei der Vergabe eindeutiger 64-Bit IDs Überlauf und wieder freigewordene IDs ignorieren und einfach nur dumm hochzählen kann. Der Wertebereich hält für so ziemlich alle praktischen Belange "ewig" (fast 600 Mio. Jahre bei 1000 IDs/s). 64-Bit ints sind schon nicht immer leicht intuitiv begreifbar 😉



  • @Finnegan sagte in Rechnung gibt falsches Ergebnis.:

    Ja, das muss man sich echt immer wieder mal ausrechnen, um sich dessen bewusst zu werden. Gebe dir recht. Da braucht man echt erst ein übergelagertes zweites Koordinatensystem, wenn die Welt grösser als ein Planet werden soll - oder man Objekte auf Atomgrösse braucht.

    Es gibt für solch skurrilen Fälle bereits QuadPrecision Bibliotheken, die fast die Genauigkeit nativer Quad Precision Implementationen erreichen. Der große Unterschied zwischen IEEE Double und Quad ist, dass von den zusätzlichen 64Bit fast alles für eine Vergrößerung der Mantisse genutzt wird d.h. die Mantisse vergrößert sich von 53 auf 113 Bit. Der Exponent wächst nur von 11 auf 15 Bits.

    QuadPrecision konnten die HP PA CPUs in Hardware.


Anmelden zum Antworten