Klassenfrage :)
-
Du rufst
calc()
aber jedesmal inonMouseOver
auf, so daß bei jedem Aufruf neuer Speicher alloziert wird (der Destruktor wird ja erst aufgerufen, wenn das gesamte_Apple
-Objekt gelöscht wird).Du brauchst auch nicht jedesmal wieder neuen Speicher anzufordern, da sich ja
xres
undyres
währenddessen nicht ändert, d.h. bei Umstellung aufvector<...>
reicht es diesen einmalig in der passenden Größe zu erzeugen (bzw. direkt inInit(...)
).Und bei der Umstellung erstelle auch nur einen eindimensionalen Vektor der Größe
xres * yres
, anstatt, wie bisher, 2 dimensional und benutzex + y * yres
als Index.Und bzgl. Performance kann man deinen Programmcode um einiges noch verbessern, da du viel zu viele unnötige Speicherallokationen und Berechnungen durchführst (und bei einem besseren Design, d.h. Codestruktur, könnte man einiges viel eleganter lösen).
-
@EL-europ Wenn du Performance Probleme hast, wie kompolierst du denn?
Wenn du wirklich zum ausführen und nicht zum debuggen kompilierst, solltest du mit-O2
kompilieren.
-
@Th69
Der Code hat ein einen Haufen Kosmetik nötig, das stimmt. Und jetzt verstehe ich auch den Fehler mit der Freigabe des Speichers, Ich "Nulle" ja nur den Zeiger . Also müsste ein free(th_matrix) anstatt eines th_matrix = NULL ausreichen um mal den groben Schnitzer zu beheben. Danke!
Ich rufe Apple->calc() nur auf wenn der entsprecndeButton in der Ui oder linke+rechte maustaste über dem Apple gedrückt wird (Zoom).
soviel Kosmetik ist es nun auch nicht. Die Bitverschieberei ist sauber denke ich, kann aber kein 24bpp testen (liegt wohl am raspios).
-
@Finnegan
Danke erstma
In Apple.calc() der Threadfunktion, bekomme den Zeiger auf die lokale Variable x nicht in die Funktion übertragen. Wenn ich "static void thrFunc(int val)" deklariere zweifelt mir das der compiler an. Und wenn ich nicht (void*) sonder (int*) im aufruf übergebe compiliert er zwar ohne Fehler läuft aber direkt in einen speicher fehler.
Mit sanitizer::leak sagt er mir am ende der Apple->calc(), wenn er Userinterface->writeText wiederholt aufrufen soll, das der zeiger auf eine "Zeropage" weist. Ein std::cout<<"start funk\n" zu begin der writeText() zeigt das er sie nicht wieder aufruft. Mit sanitizer::adress bleibt er auch dort hängen mit der Meldung das das memcpy einen memorie-overlap hat. (Auch wenn fbspiegel als std::vector funkioniert). Jedoch habe ich bis jetzt keine Zweifel an der Display->drawSpiegel() Funktion welche mittels memcpy den spiegel in das Devicefile schreibt?
Auf git ist jetzt genau diesr Stand. Die Sanitizer stürzen das prog an der oben beschriebenen Stelle ab, ohne die Sanitizer scheinst es problemlos zu laufen
-
Du kannst nicht einfach ein per Doppelzeiger angelegtes Array (
int** matrix
) sequentiell kopieren:matrix = (int**)malloc(paras.xres * sizeof(int*)); for(int i=0; i<paras.xres; i++) matrix[i] = (int*)malloc(paras.yres * sizeof(int));
vs.
memcpy(matrix, thr_matrix, paras.xres*paras.yres*sizeof(int));
Wenn das schon in deinem Original C-Code so drin war, dann war auch der schon nicht korrekt und führte zu Speicherüberschreibern.
Ich verstehe auch nicht, warum du überhaupt für die Threads die Matrix kopierst, anstatt gleich
matrix
zu beschreiben?!Auf was für einem Prozessor (mit wievielen Kernen) führst du denn überhaupt den Code aus (damit sich die Threads überhaupt lohnen)?
PS: Hast du denn einen C++11 Compiler, denn dann kannst du std::thread benutzen?!
Aber ich denke, auf diese Art wirst du nicht wirklich weiterkommen, da dir anscheinend grundlegendes C bzw. C++ Wissen fehlt.
-
@Th69
Ich allociere sequenziell den speicher weil ich mit [x][y] einfacher rechnen kann als mit [x*y] (im Kopf bei der Bitverschieberei), verstehe aber grade nicht wo das ein prob sein kann. Oder vermutest du Rechenfehler?
Zu den Threads: Ich brauche ja ein array von Threads für jeden Abschnitt der x-Achse, weil ich sie ja alle wieder joinen muss und zuvor nicht weiß wieviele Threads es pro Abschnitt sind. Ich verstehe grade ein weing die std::vektor, und hab keine Ahnung wie ich in c++ ein Array von Threads, denen ein Zeiger auf eine lokale Variable übergeben wird mit dem sie die getItter()-Funktion aufrufen und deren Rückgabewert in matrix und colormatrix schreiben, erstelle. Die loaken thr_matrix und thr_colors Arrays sind nur zum kopieren weil ich nicht weis wie ich die "eigentliche" Threadfunktion umgesetzt bekomme und meinen c-code benutzen muss. Aus den Funktionen Methoden zu machen scheint mir unnötig wenn ich sie eh nicht "richtig" nutzen kann. Die sind praktisch nur weil ich mit der *thrFunction() nicht auf Apple->matrix und Apple->colormatrix zugreifen kann.Und die Threadfunktion befinde ich als gut weil sie ohne "Semaphoren" und "Raceconditions" auskommt von denen ich noch weniger Ahnung als vom ganzen Rest
Ich beutze eine RPI5 (4-kerner) und gcc 12.2
-
@Th69 sagte in Klassenfrage :
...
Aber ich denke, auf diese Art wirst du nicht wirklich weiterkommen, da dir anscheinend grundlegendes C bzw. C++ Wissen fehlt.Dein teile deines doch bitte mit mir zumindest bezüglich der Threads
-
@EL-europ sagte in Klassenfrage :
Ich allociere sequenziell den speicher ...
Tust du doch nicht, s. meinen geposteten Code von dir bzgl.
malloc
...Ich be(n)utze eine RPI5 (4-kerner) und gcc 12.2
Und warum dann 13 Threads, wenn du eh nur 4 Kerne auslasten kannst (die anderen Threads müssen sich ja dann abwechseln - und dann kannst du gleich diese sequentiell bearbeiten)?!
Dein teile deines doch mit mir zumindest bezüglich des Threads
Ich meinte damit hauptsächlich dein Verständnis bzgl. der Speicherallokationen und -zugriffe.
Und ich hatte dir doch den Link zu C++std::thread
gegeben - dann mach dich mal darüber schlau...
-
@Th69 sagte in Klassenfrage :
@EL-europ sagte in Klassenfrage :
...
Und warum dann 13 Threads, wenn du eh nur 4 Kerne auslasten kannst (die anderen Threads müssen sich ja dann abwechseln - und dann kannst du gleich diese sequentiell bearbeiten)?!Das regelt die Systembibliothek
-
@Th69 sagte in Klassenfrage :
@EL-europ sagte in Klassenfrage :
...
Ich meinte damit hauptsächlich dein Verständnis bzgl. der Speicherallokationen und -zugriffe.
Und ich hatte dir doch den Link zu C++std::thread
gegeben - dann mach dich mal darüber schlau...Das ich in c++ rohe c-array benötige ist vielleicht schwach, aber wo liegt der Fehler?
-
Ich habe gerade mal in dein Makefile geguckt. Du scheint immer noch keine Optimierungsflags zu nutzen. Das solltest du immer machen, z.b.
-O2
: https://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html
Das ist viel wichtiger, als zu versuchen manuell mit mehreren Threads irgendwie die Performance zu optimieren.memcpy
kopiert einen zusammenhängenden Speicherblock, deine Matrix ist aber kein zusammenhängender Block, sondern ein Array, in dem jeder Eintrag auf einen anderen Block zeigt.Hier im Forum gibt es irgendwo einen Thread, in dem sehr gute erklärt wird, wie man eine Matrix Klasse in C++ programmieren würde, damit man (x, y) Zugriff hat, aber trotzdem den Speicher direkt im Block vorliegen hat, was auch aus Performance Gründen Vorteile hat.
Wenn du den Malloc Teil weglassen würdest, und zum Beispiel einfach mit
std::vector<std::vector<int>>
arbeiten würdest, wären es immer noch kein zusammenhängender Speicherblocke und es ging schöner, aber du bräuchtest keinmalloc
keinfree
und einzelne Komponenten kopieren würde einfach so funktionieren, wie du es erwarten würdest.
-
@Schlangenmensch sagte in Klassenfrage :
Ich habe gerade mal in dein Makefile geguckt. Du scheint immer noch keine Optimierungsflags zu nutzen. Das solltest du immer machen, z.b.
-O2
: https://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html
Das ist viel wichtiger, als zu versuchen manuell mit mehreren Threads irgendwie die Performance zu optimieren.memcpy
kopiert einen zusammenhängenden Speicherblock, deine Matrix ist aber kein zusammenhängender Block, sondern ein Array, in dem jeder Eintrag auf einen anderen Block zeigt.Hier im Forum gibt es irgendwo einen Thread, in dem sehr gute erklärt wird, wie man eine Matrix Klasse in C++ programmieren würde, damit man (x, y) Zugriff hat, aber trotzdem den Speicher direkt im Block vorliegen hat, was auch aus Performance Gründen Vorteile hat.
Wenn du den Malloc Teil weglassen würdest, und zum Beispiel einfach mit
std::vector<std::vector<int>>
arbeiten würdest, wären es immer noch kein zusammenhängender Speicherblocke und es ging schöner, aber du bräuchtest keinmalloc
keinfree
und einzelne Komponenten kopieren würde einfach so funktionieren, wie du es erwarten würdest.Die colormatrix schreibe ich ja auch entsprechend ihres Aufbaus in den fbspiegel den ich dann mit memcpy ins Devicefile kopiere. Da liegt der Fehler nicht und es funktioniert ja ohne die Sanitizer bis auf die Meldung, das er die Breite des Wertes einer arithmetischen Operation nicht kennt, in der Thread-Funktion.
-
@EL-europ sagte in Klassenfrage :
Das ich in c++ rohe c-array benötige ist vielleicht schwach, aber wo liegt der Fehler?
Sorry, aber das Kernproblem liegt daran dass du auf Ratschläge anderer nicht hörst und vor allen Dingen du dich nicht weiterbildest und Sachen prüfst.
Sehr viele Sachen in der Informatik lassen sich beweisen. So auch die Aussage "Du kannst nicht einfach ein per Doppelzeiger angelegtes Array (int** matrix) sequentiell kopieren"
Eine kleines Prüfprogramm ergäbe dann folgendes:
#include <stdlib.h> #include <stdio.h> // Testprogramm int main() { int xres = 5; int yres = 5; int **matrix = (int**)malloc(xres * sizeof(int*)); for (int i = 0; i < xres; i++) matrix[i] = (int*)malloc(yres * sizeof(int)); int Count = 0; for (int x = 0; x < xres; x++) { for (int y = 0; y < yres; y++) { matrix[x][y] = Count++; } } // memcpy greift sequenziell zu, also gebe ich diese mal sequenziell aus int* P = matrix; //int* P = *matrix; for (int i = 0; i < xres * yres; i++) { printf("%i ", *P); if (i % xres == 0 && i != 0) printf("\n"); P++; } return 0; }
-
@Quiche-Lorraine memcpy schreibt nur den fbspiegel ins Devicefile, putSpiegel und putDevice übersetzen die Matrizen
-
memcpy(matrix, thr_matrix, paras.xres*paras.yres*sizeof(int));
Von hier: https://github.com/momefilo/mandelbrodt/blob/main/include/_Apple.cpp
-
@Schlangenmensch
Ah mom das Funktioniert also nur weil er zufällig zusammenhängenden Speicher alloziert? Oder wo ist das prop?
die matrix ist ja std::vector und die thr_matrix ein rohes array, ist dort ein pproblem?
-
@EL-europ Es "funktioniert" gar nicht. Du kopierst
paras.xres*paras.yres*sizeof(int)
Bytes vonthr_matrix[0][0]
beginnend nachmatrix[0][0]
.
Wenn dir der Speicher gehört, wird das kopiert was da drinnen steht. Wenn dir der Speicher nicht gehört, macht vermutlich dein Programm nen Abflug.In dem Code der im Github ist gibt es an der Stelle keinen
std::vector
, das ist einint **matrix;
siehe (https://github.com/momefilo/mandelbrodt/blob/main/include/_Apple.h)
-
@Schlangenmensch
ich muss wohl warten bis ich mir ein neues Buch Kaufe und die Ganze Thread-Funktion im sauberem c++ hinzubekommen. so das dort die c-arrays überflüssig werden. Denn wenn ich darüber iterieren muss um zu kopieren geht mir der Vorteil durch die threads zum Teil zumindest wieder verloren
-
@Schlangenmensch
Ja genau die matrix hab ich ja deswegen als solches definiert, also wo soll da das Problem sein?
Das ist kein Lehrbuchcode aber er läuft auf meinem Raspi5, nach dem beheben des groben Schnitzers, bei mir einwandfreiBin grad wieder am Funktionen hizufügen weil ich sonst nichts mit dem Code machen kann ohne neues Buch. Und die Funktionen sind einfach ohne Threads, dazu reicht mir Internet
-
@EL-europ sagte in Klassenfrage :
Ah mom das Funktioniert also nur weil er zufällig zusammenhängenden Speicher alloziert? Oder wo ist das prop?
Führe doch mal das Beispiel aus! Ist nicht schwer und beisst dich nicht! Aber der Erkenntnisgewinn wird groß werden!