Optimierung meines Mandelbrot-Explorers
-
@RudiMBM sagte in Optimierung meines Mandelbrot-Explorers:
Du beziehst dich auf Folgen mit c = (0|0), oder c = (-1|0), und andere dieser Sorte.
Nö, ich bezieh mich auf so Folgen die zwischen ein paar Punkten hin und her springen. Keine Ahnung ob's von denen jetzt besonders viele gibt. Konvergieren die klassischen "Kringel" alle zu einem Punkt in der Mitte? Von denen gibt's nämlich haufenweise, zumindest im fetten Klopps in der Mitte. Wobei der für dich natürlich uninteressant ist
Ich hab mir solche Folgen haufenweis in den Zeitreihen angesehen. Reihen, die oft über 100k Iterationen dauerten. Ich denke Du hast kein Programm das sowas zeigen kann.
Hab ich tatsächlich nicht. Wenn mein Vorschlag für dich nicht brauchbar ist, hab ich damit kein Problem, ich werd nicht versuchen dir einzureden dass was funktioniert was halt nicht funktioniert. War einfach mein "best guess".
Hast du eins mit dem man sich da mal spielen könnte? Also jetzt nicht unbedingt dein Code, gibt ja etliche Programme in der Richtung, aber ich weiss nicht welche da gut sind.
In Deinem Programmvorschlag verdoppelts Du iref immer. Da bin ich am Grübeln wie damit ein 3er oder 5er, usw Zyclus erkannt werden soll, oder gar einer im tausender Bereich.
Durch die Verdoppelung verdoppelt sich auch immer die Iterationsanzahl bis der Referenzwert wieder wechselt. D.h. du hast erstmal für zwei Iterationen den selben Wert, dann wieder für 2, dann für 4, dann für 8 usw.
Wenn du jetzt einen Zyklus mit Länge 123 hast, dann wird dieser erkannt sobald der Punkt erreicht ist wo der Referenzwert für 128 Iterationen behalten wird. Weil sich ja alle 123 Werte des Zyklus wiederholen, und damit kommt irgendwann wieder der Referenzwert den man sich behalten hat. Das ist also kein Problem. Standardmethode zum Erkennen von Zyklen unbekannter Länge.
Was eher ein Problem sein wird, ist dass die ganze Gaudi nicht sofort in den stabilen Zyklus geht, sondern erst langsam da hin driftet. (IIRC wird der stabile Zyklus sowieso nur im Limes erreicht)
Und eben die oben erwähnte Sache dass ich nicht weiss wie häufig solche Zyklen wirklich sind. Andrerseits sollte es auch für Zyklen mit Länge 1 gehen.
PS.: und was ist nun mit der GPU los? Da hätt ich gern eine Anleitung zu Deinem Vorschlag.
Wie man das im Detail macht kann ich dir auch nicht sagen. Ich weiss nur dass die GPU für so Numbercrunching Sachen oft super gut geht. Was extended precision Zeugs angeht kann ich dir also nix konkret empfehlen. Ausser mal zu googeln ob du da was findest - falls es dich interessiert. Mit CUDA kannst du ja z.B. sogar C++ Code ohne grosse Einschränkungen auf der GPU laufen lassen. Also gehen müsste es IMO auf jeden Fall.
-
Vielleicht hilft ein kleines Beispiel was die Zyklenlänge angeht:
z zref 1 - 2 1 3 1 4 3 5 3 1 3 2 3 3 2 4 2 5 2 1 2 2 2 <-- treffer 3 2 4 2 5 2 ... ...
Stimmt jetzt nicht genau mit meinem Code zusammen, aber sollte verdeutlichen dass man mit Verdoppelung der Abstände zwischen den "Samples" sämtliche Zyklen findet, egal wie lange die sind.
-
@hustbaer sagte in Optimierung meines Mandelbrot-Explorers:
Kringel
Danke @hustbaer. Habe das Wort einmal im Zusammenhang mit kubischen Splines gelesen (benutzte selbst das Wort Schlaufen), dann vergessen (aber nicht die Existenz) und vergebens gesucht. Und heute - oh Glück - da lese ich das Wort wieder. Vielen Dank.
-
@titan99_ Ja, ich wusste nicht wie ich sonst sagen soll. Und ich wollte es auch nicht umständlich beschreiben. Und dann ist mir das Wort "Kringel" eingefallen
Wobei es eben fürchte ich eher Spiralen sind. Andrerseits sollte das alles egal sein, so lange man Epsilon klein genug wählt.
-
@hustbaer In dem Abschnitt, in dem Du das Wort Kringel benutzt hast, folgt deiner Meinung nach, mich würde "der fette Klops in der Mitte" nicht interessieren, und das hellseherisch als natürlich zu betrachten. Das wollte ich bisher nicht diskustieren, aber es hat mich gekränkt. Gerade der Unterschied des Verhaltens im großen Klops zu den kleinen Klöpsen fand ich spannend. Und gerade die kleinen Klöpse in diesen Algorithmus zu intergrieren ist die Herausforderung. Im großen Klops ist das leicht. Dann gibt es ja noch die ganz kleinen Klöpse, nicht zu vergessen die Satelliten mit all ihren superkleinen Klöpschen.
Dein Programm werde ich mal testen, dauert ein bischen - Kommentar kommt - und das sachlich, aber ich vermute schon, Dein Algo funktioniert nur im großen Klops. Wenn doch mea culpa.
Zu Deinem letzten Post an titan99: ja, es sind Spiralen, und es sind Spialen in Spiralen, Und pro Klöpschen noch ne Spirale drauf. Und das, bis Dir der Kopf schwindelig wird. Guck mal in die Wikipedia MBM:Intermediär wechselhaftes Verhalten , da gibts einen kleinen Einblick. Sollte Dein Algo diese Folge richtig decodieren, wäre ich platt.
Nicht zu vergessen, dieser Wiki-Edit mit Bildern stammt von mir.
-
@RudiMBM sagte in Optimierung meines Mandelbrot-Explorers:
@hustbaer In dem Abschnitt, in dem Du das Wort Kringel benutzt hast, folgt deiner Meinung nach, mich würde "der fette Klops in der Mitte" nicht interessieren, und das hellseherisch als natürlich zu betrachten. Das wollte ich bisher nicht diskustieren, aber es hat mich gekränkt.
Ähm, OK. Sorry, war nicht meine Absicht. Nur wieso kränkt dich das? Meine Einschätzung davon was dich interessiert war falsch. War ja aber doch nicht böse/abwertend gemeint.
Dein Programm werde ich mal testen, dauert ein bischen - Kommentar kommt - und das sachlich, aber ich vermute schon, Dein Algo funktioniert nur im großen Klops. Wenn doch mea culpa.
Du musst dich auch nicht entschuldigen wenn deine Einschätzung des Erfolgs des von mir vorgeschlagenen Algorithmus falsch ist, und schon gar nicht präventiv. Wenn du es ausprobieren und dann das Ergebnis berichten magst freut mich das
-
@hustbaer Ergebnis des Vergleichtests:
Die Bilder, die hier verlinkt sind zeigen farbcodiert bei welchen Itercount die Folge beendet wurde.
Für beide Versionen, sind 16 Bilder mit Epsilon von 1e-16 bis 0,1 zu sehen.
Version 1--> https://youtu.be/eRx978hVCV0?t=52
Version 2--> https://youtu.be/eRx978hVCV0?t=6 (hustbaer Vers.)-
Der Zweck, konvergente Folgen schneller zu erkennen funktioniert bei beiden. (zumindest in diesen Test)
-
Bei Maxiter=100k und Epsilon= 1e-16 rechnet Vers.1 2m14sec, Vers2 3m45sec, ohne optimierung wären es 47min.
-
Beide funktionieren mit Epsilon < 1e-5. Bei tieferem Zoom entsprechend noch kleiner.
Obwohl für den geplanten Einsatz uninteressant, würde es mich schon interessieren wie diese Muster begründet sind. Vielleicht steckt ja ein kleines Erkenntnis unbekannter Eigenschaft der MBM dahinter.
-
-
@RudiMBM
Interessant. Hast du das initialeimin
in Version 1 hand-getuned für dieses Bild (diesen Ausschnitt)? Wenn nicht wundert es mich nämlich etwas dass Version 1 schneller ist.
-
@hustbaer Nun, da muß ich was vorausschicken. Mein Explorer arbeiten mit einen Festkommaformat zZ. aus 360Bits + Status für z und c; Da ich in Vers1 im ersten Schritt nur i mit imin als integer vergleiche bin ich da viele schneller. Vers2 vergleicht aber in jedem Loop 360 bit 360 Bits, falls die Unterschiede nur sehr klein sind, und auf das sind wir ja mit Epsilon aus. Das dauert. Das wird sich wohl annähern, wenn z nur double ist. Float hab ich aber aus Optimierungs-Gründen verworfen, da in der MBM sich die meisten Iterationsergebnise im Bereich von 1,xxxxx bewegen. Und das wäre mit long double Epsilon 1e-18 schon viel zu ungenau. Ohwohl ich ahne was passiert, ich könnte den ganzen Test auch mit long double machen, meinen Explorer kann ich zwischen mehreren Formaten umschalten.
-
@RudiMBM
Ah, ja, macht Sinn.
Etwas optimieren könnte man das ganze noch indem manabs_squared(z - zref) < EpsilonSquared
stattabs(z - zref) < Epsilon
macht. Falls du das nicht schon sowieso gemacht hast.Ansonsten... man könnte die Anzahl der Vergleiche auch kleiner halten. Die Zyklen werden ja vermutlich nicht so brutal lange sein - also verglichem mit
Itermax
meine ich. D.h. es würde wohl auch reichen pro Verdoppelung von iref nur z.B.(iref+7)/8
oder(iref+15)/16
Tests direkt hintereinander zu machen. Und zusätzlich alle 8 oder 16 Schritte, damit man beim Konvergieren zu einem einzelnen Punkt nicht viel zu lange wartet.ps: Noch besser wäre denke ich die "Chebyshev distance" oder "Manhattan distance" zu verwenden - damit bräuchte man dann nichtmal mehr ne Multiplikation. Das sollte dann mMn. kaum mehr merkbar sein, da die paar Additionen/Subtraktionen/Vergleiche die man da hat deutlich billiger sein sollten als das Quadrieren von z.
-
@hustbaer Ja, in beiden Vers. wird nur das quadrat von z verglichen. Soll ja optimiert ablaufen.
-
@RudiMBM sagte in Optimierung meines Mandelbrot-Explorers:
@hustbaer Ja, in beiden Vers. wird nur das quadrat von z verglichen. Soll ja optimiert ablaufen.
Dann probier mal "Chebyshev distance" oder "Manhattan distance". Das sollte nochmal einiges bringen.
"Chebyshev distance" ist einfach nur
max(abs(x2-x1), abs(y2-y1))
und "Manhattan distance" istabs(x2-x1) + abs(y2-y1)
. Bzw. haltr
undi
stattx
undy
in diesem Fall.Für die Entscheidung ob der Fehler klein genug ist, sollten beide ausreichend sein. (Bei der "Chebyshev distance" müsstest du noch Epsilon halbieren damit der Vergleich fair ist.)
-
@hustbaer Wozu das? In der Iter-Formel fällt sowieso real² und Imag² an, da brauch ich nur 1 Addition für Pytagoras abs(z)². Allerdings möchte ich erwähnen, dass ich Epslilon bereits als squared ein- und angegeben habe. Im Test war das 1e-16. Unsquared wären das dann 1e-8.
-
@RudiMBM sagte in Optimierung meines Mandelbrot-Explorers:
@hustbaer Wozu das? In der Iter-Formel fällt sowieso real² und Imag² an, da brauch ich nur 1 Addition für Pytagoras abs(z)².
Ähm. Ich versteh' jetzt mal nicht wie das gehen soll. Wo sollen in der Iteration
(z_r - zref_r)²
und(z_i - zref_i)²
anfallen?EDIT: Also ich rede von dieser Zeile da:
if (abs(z - zref) < Epsilon)
-
@hustbaer sagte in Optimierung meines Mandelbrot-Explorers:
Also ich rede von dieser Zeile da: if (abs(z - zref) < Epsilon)
dann mach doch mal
if ( abs( z²-zref²) < Epsilon²)
dann brauchste nicht vorher Wurzelziehen. Und geht doch, oder?
-
@RudiMBM
Geht schon, ist bloss nicht das selbe.
(a-b)² = a² - 2ab + b² und nicht a² - b²Damit bekommst du einerseits zu grosse bzw. zu kleine Fehlerwerte (je nachdem ob du ausserhalb oder innerhalb des Einheitskreises bist). Beispiel: (2-3)² ist 1 aber |2²-3²| ist 5*.
Und andrerseits bekommst du false positives.
Also ich persönlich würde da wirklich einfach eine andere Distanz-Metrik verwenden.
*: Ja, ich weiss dass der Bereich ausserhalb der Mandelbrotmenge liegt. War nur ein Beispiel, im "relevanten" Bereich werden die Abweichungen geringer sein. Trotzdem sind sie da, und variieren vor allem je nachdem wie weit man vom Einheitskreis entfernt ist. Und speziell im Bereich r=0.25, der ja auch halbwegs interessant sein sollte, sind die Abweichungen dann schon nicht mehr so klein.
-
Ihr solltet auch Bedenken, das der PC nie eine wirklichen Reihe berechnet. Sondern nur eine Näherung, die wegen der chaotischen Natur immer weiter abweicht, von der richtigen Reihe. Ist z aus zwei floats, gibts grad mal 2^63 Kombinationen. Nochmal weniger, wenn man den Exponent beschränkt. Man sollte also echt mal einfach alle z markiert, die in Zyklenlängen über x vorkommen, bzw. einfach jedes z nach x Gliedern der Zyklen. Dann hat man eine Obergrenze von Rechenschritten, mit dem für jedes z die Lösung bestimmt wird.
-
@TGGC z ist komplex, also bei double wären das dann schon 2^126. Und @RudiMBM (bzw. sein Programm) rechnet mit 360 Bit Fixkommazahlen. Also 2^720. Hui
-
@TGGC sagte:
Ihr solltet auch Bedenken, das der PC nie eine wirklichen Reihe berechnet. Sondern nur eine Näherung, die wegen der chaotischen Natur immer weiter abweicht, ....
Das ist ein weitverbreiteter Irrtum, dass in der Computer-MBM-Iterations-Folge das Chaos beteiligt ist. Die Abweichungen entstehen durch die Begrenzung der Nachkommastellen. Bei den Multiplikationen werden hinten signifikante Ziffern nach rechts rausgeschoben. Bei sqrt(x) zB. werden wieder Nachkommastellen von rechts hereingeholt, und das sind in der Regel Nullen. Bei sqrt(x²) bleibt also nur die halbe Genauigkeit übrig. (Nicht in der reinen Mathematik) Ab diesen Iterationsschritt ist die Folge verfälscht, oder man kann sagen es ist eine Andere. Das wahre Chaos kann nur in einem analogen System erfolgen, Da gibt es keine Nachkommastellen, oder je nachdem unendlich viele.
-
@hustbaer sagte:
Geht schon, ist bloss nicht das selbe.
(a-b)² = a² - 2ab + b² und nicht a² - b²Ich habe in in diesem Punkt wohl sehr ungeschick formuliert.
In der Iterationsschleife wird programmiert um den neuen Betrag(z) zu erhalten:remain_iter = max_iter xx = x*x yy = y*y xy = x*y betrag_z² = xx + yy WHILE (betrag_z² <= max_betrag_z²) AND (remain_iter > 0) remain_iter = remain_iter - 1 x = xx - yy + cx y = xy + xy + cy xx = x*x yy = y*y xy = x*y betrag_z² = xx + yy // hier der break-Test END
Aus betrag_z² wird letztlich betrag_zref² ermittelt, und wenn ich beide Quadrate subtrahiere (großes - kleines), bleibt eine Restfläche übrig. Wenn die kleiner ist als Epsilon² bin ich fertig.