Alle CPUs nutzen friert Rechner ein

SeppJ

Da OpenMP ein high-level Threadingframework ist, sollte es eigentlich genug sein, einfach die Priorität des ganzen Prozesses (oder was auch immer das Äquivalent eines Unix-Prozesses bei deinem Betriebssystem ist) zu senken. Das auf Threadebene zu micromanagen klingt nach keiner guten Idee.

hustbaer

Eisflamme schrieb:

gibt es einen Trick, wie man dafür sorgt, dass man nicht den ganzen PC einfriert, wenn man alle Threads für eine Berechnung nutzt?

Wenn die Threads mit Priorität 0 laufen, und man nicht zu viele erzeugt (=nicht wesentlich mehr als man Hardware-Threads hat), dann muss man - zumindest unter Windows - gar nix tun. *

Probier' einfach mal Prime95 oder sowas starten, mit so vielen Threads wie du Hardware-Threads hast. Wenn ich das mache, kann ich daneben "ganz normal" weiterarbeiten. Also es wird vermutlich alles messbar länger dauern, aber ich merke da wirklich keinen drastischen Slowdown.

*: Haha, jetzt sollte ich vermutlich auch mal "disclaimern": Es gibt Fälle wo Windows quasi unbedienbar wird trotz dem man nicht mehr Threads laufen hat als die CPU Hardware-Threads kann, und trotz dem diese Threads alle die Basispriorität 0 haben. Wobei ich nicht genau weiss was der Grund ist. Aufgefallen ist mir das z.B. beim ollen Windows Taschenrechner. Wenn man für N Hardware-Threads N Instanzen vom Taschenrechner aufmacht, und auf jedem z.B. die Berechnung der Fakultät von z.B. einer Milliarde startet, dann "steht das System". So lange bis die Taschenrechner draufkommen dass sie die Fakultät von einer Milliarde gar nicht ausrechnen können. Unter Windows XP ging das sogar so weit dass DPCs um Ewigkeiten verzögert wurden (k.A. wie sich das unter Win 7/8/10 verhält, aber es würde mich nicht wundern wenn sich daran nix geändert hätte).

Vielleicht sollte ich da mal mit dem Debugger gucken was der verdammte Taschenrechner da anstellt...

Und natürlich nochwas: Wenn die Worker-Threads viel IO machen, dann können sie schlimmer bremsen. Vorausgesetzt die IOs gehen schnell genug und es gibt so viele Worker-Threads dass immer genug "runnable" sind um die CPU komplett auszulasten. Denn dann bekommen sie von Windows nen Prioritäts-Boost, jedes mal wenn ein IO fertig geworden ist. Und wenn sie schnell genug den nächsten IO machen, dann laufen sie effektiv immer geboostet. Und DANN kann man mit dem System auch nicht mehr ordentlich arbeiten.

hustbaer

Eisflamme schrieb:

Mir ist aufgefallen, dass auch mein UI-Prozess sehr langsam bzw. schlecht zu bedienen wird, wenn OpenMP eine Berechnung durchführt. Das ist ansich ja auch klar,

Naja, das sollte eben eigentlich nicht so sein.
Es sei denn OpenMP gibt den Worker-Threads per Default ne richtig hohe Priorität.

Kannst du mal gucken wie die Default-Priorität der OpenMP Threads ist?

SeppJ

hustbaer schrieb:

Eisflamme schrieb:

Mir ist aufgefallen, dass auch mein UI-Prozess sehr langsam bzw. schlecht zu bedienen wird, wenn OpenMP eine Berechnung durchführt. Das ist ansich ja auch klar,

Naja, das sollte eben eigentlich nicht so sein.
Es sei denn OpenMP gibt den Worker-Threads per Default ne richtig hohe Priorität.

Kannst du mal gucken wie die Default-Priorität der OpenMP Threads ist?

In der Hinsicht ist auch sehr wichtig, welches Betriebssystem eingesetzt wird, mitunter sogar welche Version des Kernels. Bei Linux gab es beispielsweise vor ein paar Jahren größere Änderungen in Sachen der Priorität gebündelter Prozesse (wobei das aber eigentlich Threads nicht unbedingt betreffen sollte). Eben mit der Absicht, solche Aussetzer der GUI in Zukunft zu vermeiden.

hustbaer

Ja, stimmt, OS ist wichtig.

Ich bin halt, da er Sleep(1) geschrieben hat, von Windows ausgegangen.

(Gibt's unter Linux/BSD/... auch ne Sleep Funktion mit grossem "S"? Ich kenne zumindest keine. Wenn ich "sleep" lese denke ich halt einfach Linux/BSD/... und bei "Sleep" halt Windows.)

rapso

SeppJ schrieb:

hustbaer schrieb:

Eisflamme schrieb:

Mir ist aufgefallen, dass auch mein UI-Prozess sehr langsam bzw. schlecht zu bedienen wird, wenn OpenMP eine Berechnung durchführt. Das ist ansich ja auch klar,

Naja, das sollte eben eigentlich nicht so sein.
Es sei denn OpenMP gibt den Worker-Threads per Default ne richtig hohe Priorität.

Kannst du mal gucken wie die Default-Priorität der OpenMP Threads ist?

In der Hinsicht ist auch sehr wichtig, welches Betriebssystem eingesetzt wird, mitunter sogar welche Version des Kernels. Bei Linux gab es beispielsweise vor ein paar Jahren größere Änderungen in Sachen der Priorität gebündelter Prozesse (wobei das aber eigentlich Threads nicht unbedingt betreffen sollte). Eben mit der Absicht, solche Aussetzer der GUI in Zukunft zu vermeiden.

stimmt, bin deswegen damals bei meinem netbook auf fedora umgestiegen, war genau zu der zeit.
unter winXP fing der mp3 player an zu stottern wenn ich kompilierte oder flash websites aufmachte, unter linux konnte lief alles besser, weil sie damals das scheduling erst pro process und dann auf threads aufgeteilt haben.

window ist bis heute seltsam (wobei win10 merklich besser ist beim scheduling, finde ich), manchmal kann ich alles an rechenleistung ausnutzen und nebenbei youtube schauen, auf der anderen seite blockt manchmal ein prozess sogar den mauskursor.
ich hab das gefuehl es hat ein wenig mit dem windows memory management zu tun. windows tagt wohl sporadisch immer mal memory pages als potentiel auslagbar und wenn man darauf zugreift, geht man in den page handler. das scheint sehr single threaded zu laufen und wenn mehrere threads page faults generieren, stallen sie wohl in einem zustande wo der scheduler die cores nicht re-usen kann.

unter linux und osx hab ich das gefuehl dass der memory manager nichts mit auslagerung macht solange genug speicher vorhanden ist.

Eisflamme

Hi,

hustbaer: Richtig erkannt, ich nutze Windows.

Da OpenMP ein high-level Threadingframework ist, sollte es eigentlich genug sein, einfach die Priorität des ganzen Prozesses (oder was auch immer das Äquivalent eines Unix-Prozesses bei deinem Betriebssystem ist) zu senken.

Also wenn ich das hier nicht falsch verstehe, habe ich eigentlich einen Hauptthread, der auch die UI-Eventloop verwaltet, und der ruft OpenMP auf... wäre jetzt ziemlich sinnlos dessen Priorität zu senken, dann haben die OpenMP-Threads ja wieder dieselbe Priorität wie der Mainthread. UI ist QT, falls das was ändern sollte.

Kannst du mal gucken wie die Default-Priorität der OpenMP Threads ist?

Geschaut, haben alle THREAD_PRIORITY_NORMAL (0)

Meine Threads nutzen kein I/O, jedenfalls nicht die, die ich zurzeit parallelisiert habe. Würde ich mit den anderen aber auch noch machen wollen.

rapso

Eisflamme schrieb:

Hi,

hustbaer: Richtig erkannt, ich nutze Windows.

Da OpenMP ein high-level Threadingframework ist, sollte es eigentlich genug sein, einfach die Priorität des ganzen Prozesses (oder was auch immer das Äquivalent eines Unix-Prozesses bei deinem Betriebssystem ist) zu senken.

Also wenn ich das hier nicht falsch verstehe, habe ich eigentlich einen Hauptthread, der auch die UI-Eventloop verwaltet, und der ruft OpenMP auf... wäre jetzt ziemlich sinnlos dessen Priorität zu senken, dann haben die OpenMP-Threads ja wieder dieselbe Priorität wie der Mainthread. UI ist QT, falls das was ändern sollte.

du sprachst weiter oben davon dass du einen eigenen UI prozess hast

dass auch mein UI-Prozess sehr langsam

falls du nur einen thread hast der nicht mehr UI events verarbeitet weil er mit OpenMP berechnungen ausfuehrt, ist das eine ganz andere situation.

Eisflamme

Hi,

also das UI läuft im selben Prozess wie auch der Rest des Programms. Wollte damit nicht sagen, dass das Hauptprogramm einen Prozess erzeugt, welcher das UI verarbeitet, das geschieht hier nicht.

OpenMP wird also aus demselben Prozess gestartet, der auch die Eventloop beinhaltet.

hustbaer

Dir ist aber schon klar dass OpenMP in dem Sinn synchron ist dass der Thread der auf OpenMP Konstrukte wie parallel for trifft erst weiter läuft wenn diese Konstrukte vollständig abgearbeitet wurden?

rapso

Eisflamme schrieb:

OpenMP wird also aus demselben Prozess gestartet, der auch die Eventloop beinhaltet.

was wuerde dann sowas bringen:

Eisflamme schrieb:

Setzt man einfach ein Sleep(1) oder so was in die Threads, um 100% Auslastung zu vermeiden?

das ist ein wenig verwirrend.

wenn openmp aus ist (also single threaded), funktioniert dann alles wie gewollt?

Eisflamme

Ach sorry, ich hab einfach Mist erzählt... OpenMP läuft natürlich doch in einem ausgelagerten Thread, sonst wär ja ständig alles eingefroren. Soweit ich das verstehe habe ich dennoch nur einen Prozess, wenn man jetzt mal zwischen Thread und Prozess unterscheidet. Man sieht also im Taskmanager bei Windows unter Details nur einen Eintrag.

Wenn ich den Prozess also langsamer machen würde, wäre das sinnlos, aber den Thread, der OpenMP ausführt, das wäre wohl sinnvoll. Und stimmt, das könnte ich dann tatsächlich einfach vor der OMP-Ausführung machen statt das jedem Thread einzeln anzutun.

hustbaer

Eisflamme schrieb:

aber den Thread, der OpenMP ausführt, das wäre wohl sinnvoll. Und stimmt, das könnte ich dann tatsächlich einfach vor der OMP-Ausführung machen statt das jedem Thread einzeln anzutun.

Naja OpenMP erzeugt ja haufenweise Worker.

Und die erben vermutlich die Priorität nicht von irgendwo sondern werden eben vermutlich per Default Priorität 0 bekommen.

Wie viele OpenMP Threads erzeugst du denn? Kann mir nämlich immer noch nicht ganz vorstellen warum OpenMP so reinhauen sollte dass die GUI kaum mehr erträglich funktioniert -- vorausgesetzt eben du machst nicht mehr OpenMP Threads als du Hardware-Threads hast.

rapso

oder einfach den UI thread hoeher prioritisieren, done.

Eisflamme

Also ich las, dass der Erzeuger-Thread auch die Priorität für die OpenMP-Threads festlegt. Wenn ich seine Priorität also runtersetze, dürften die durch OpenMP erzeugten Threads auch niedriger priorisiert sein.

Ich habe bislang omp_get_max_threads() genutzt. Auf meinem DualCore mit Hyperthreading, ergibt das vier. Ungeprüft und vermutet: Jetzt liegt wohl der UI-Thread auf Kern1 und die OpenMP-Threads verteilen sich wieder auf alle Kerne. Mit niedrigerer Priorität scheint es jetzt stabiler zu laufen. Alle vier Kerne sind stets zu 100% ausgelastet. Das stört ohne niedrigere Priorität das GUI und scheint eben auch andere Prozesse von Windows lahmzulegen, die gar nichts mit meiner Software zu tun haben (sehe ich erstmal als BS-Scheduling-Fail, aber gut). Testsystem war hier Windows 7. Ich selbst kann das gar nicht reproduzieren.

Ich versuche den Tester auch gerade zu erreichen, um festzustellen, ob er mit dem Update, welches die Prioritäten runtersetzt, besser fährt. Es bleibt spannend.

rapso

ich glaube du hast keinen einfluss darauf, wann der worker pool erstellt wird. du kannst im thread-view vom VS debugger dir die priorities anschauen fuer deinen fall. die threads werden vermutlich auch dynamisch verteilt, kannst also nicht von einem spezifischen kern ausgehen.

aber solange du es irgendwie hinbekommst dass der UI thread ueber den anderen ist, sollte es laufen wie du moechtest.

ja, windows 7 ist bescheiden, hab hier 32cores und wenn ich clang auf allen laufen lasse, dann kann ich nichts mehr machen (mauszeiger springt auf dem schirm sporadisch). hatte dasselbe problem auf dem laptop, seit win10 ist es besser.
ich weiss nicht, ob das ein scheduling fail ist, oder event handling in windows, oder vielleicht vom cursor-update prozess. aber sowas in einem produkt zu verkaufen ist echt arm. linux und osx zeigen dass es besser geht.