Stilfrage - pass per Value/const reference?



  • Mooooment:

    Was er da unten in seinem Start Beitrag schreibt, also das explizite fordern einer RValue Referenz als Rückgabe Type, ist doch gar nicht nötig oder?

    die string Klasse verwendet den Move Konstruktor doch im Fall eines lokal erzeugten Objekts innerhalb der Funktion automatisch oder nicht?



  • Mechanics schrieb:

    Und aus diesem Grund würde ich immer die zweite Variante nehmen. Das ist die saubere Variante mit einer sauberen Schnittstelle. Was die Funktion intern macht, ist meist zweitrangig und kann sich ständig ändern.

    Versteh ich nicht.

    Wenn ich eine Funktion mit const& Parameter sehe, dann erwarte ich dass die Funktion keine Kopie anlegt. Wenn dann trotzdem eine Kopie angelegt wird, fände ich das sehr verwirrend und unintuitiv.

    Eine saubere Schnittstelle zeichnet für mich auch aus dass sie so eindeutig wie möglich die Funktion dokumentiert - sonst könnte ich ja auch gleich überall const weglassen mit der Begründung dass vielleicht irgendwann mal der Parameter doch geändert werden können muss.



  • happystudent schrieb:

    Mechanics schrieb:

    Und aus diesem Grund würde ich immer die zweite Variante nehmen. Das ist die saubere Variante mit einer sauberen Schnittstelle. Was die Funktion intern macht, ist meist zweitrangig und kann sich ständig ändern.

    Versteh ich nicht.

    Wenn ich eine Funktion mit const& Parameter sehe, dann erwarte ich dass die Funktion keine Kopie anlegt. Wenn dann trotzdem eine Kopie angelegt wird, fände ich das sehr verwirrend und unintuitiv.

    Eine saubere Schnittstelle zeichnet für mich auch aus dass sie so eindeutig wie möglich die Funktion dokumentiert - sonst könnte ich ja auch gleich überall const weglassen mit der Begründung dass vielleicht irgendwann mal der Parameter doch geändert werden können muss.

    wenn du eine Vererbungshierarchie hast und exakt eine abgeleitete Klasse jetzt eine Kopie braucht - na dann würde ich keinesfalls überall sonst das const& wegnehmen, sondern stattdessen in der einen Funktionsdefinition eine Kopie anlegen.

    Auch wenn bei einer const& nur lesend auf "funktionsexternen"
    Speicher zugegriffen wird, würde ich einen "by value"-Parameter als deutlicher getrennte Schnittstelle bezeichnen.

    du weißt ja nicht, wie die String Klasse implemntiert ist. Angenommen, die ist intern mit einem Referenzzähler implementiert, na dann greifst du auch auf die Originaldaten zu - genau wie bei const& (natürlich auch nur lesend).

    Da hier immer wieder das Argument von wegen "Compiler optimiert ja eh" kommt:
    das mag auf moderne Compiler zutreffen, aber bedenkt bitte auch, dass es für viele Plattformen nur alte C++ Compiler gibt, und die optimieren viel weniger als man vielleicht hofft.



  • gdfgdfgd schrieb:

    Auch wenn bei einer const& nur lesend auf "funktionsexternen"
    Speicher zugegriffen wird, würde ich einen "by value"-Parameter als deutlicher getrennte Schnittstelle bezeichnen.

    du weißt ja nicht, wie die String Klasse implemntiert ist. Angenommen, die ist intern mit einem Referenzzähler implementiert, na dann greifst du auch auf die Originaldaten zu - genau wie bei const& (natürlich auch nur lesend).

    Da hier immer wieder das Argument von wegen "Compiler optimiert ja eh" kommt:
    das mag auf moderne Compiler zutreffen, aber bedenkt bitte auch, dass es für viele Plattformen nur alte C++ Compiler gibt, und die optimieren viel weniger als man vielleicht hofft.

    Performance hat nichts mit einer "sauberen Schnittstelle" zu tun, um die es bei diesem Argument ging.
    Eine solche ist nach meinem Verständnis weitestgehend abgekapselt von Implementations-Details.
    Mit deinem Argument reduzierst du sogar noch gedanklich die Abkapselung, da jetzt die Verwendung einer
    Referenz sogar eine compilerspezifische Eigenheit wiederspiegelt.

    Ferner basiert mein Agrument für "by value" mitnichten auf Compiler-Optimierungen wie NRVO und dergleichen.
    Die Tatsache, dass std::string in C++11 einen Move-Kostruktor hat der in diesem Fall greift ist dafür völlig ausreichend.
    Egal wie "schlecht" der Compiler sonst optimiert.

    Finngean



  • gdfgdfgd schrieb:

    wenn du eine Vererbungshierarchie hast und exakt eine abgeleitete Klasse jetzt eine Kopie braucht - na dann würde ich keinesfalls überall sonst das const& wegnehmen, sondern stattdessen in der einen Funktionsdefinition eine Kopie anlegen.

    Hab ich aber nicht, es ging doch um eine freie Funktion?

    DocShoe schrieb:

    f ist hier eine freie Funktion



  • Finnegan schrieb:

    Performance hat nichts mit einer "sauberen Schnittstelle" zu tun, um die es bei diesem Argument ging.

    Ferner basiert mein Agrument für "by value" mitnichten auf Compiler-Optimierungen wie NRVO und dergleichen.
    Die Tatsache, dass std::string in C++11 einen Move-Kostruktor hat der in diesem Fall greift ist dafür völlig ausreichend.
    Egal wie "schlecht" der Compiler sonst optimiert.

    zu 1: eine saubere Schnittstelle ist aber const& und nicht per-value. Wenn ich per-value bei Objekten sehe, denke ich mir: mmmh, hat da jemand vergessen const& zu verwenden. Wenn in der Funktion dann eine Kopie erzeugt wird, soll das so sein, ist mir als Anwender dieser Funktion egal.

    zu 2: wer redet von C++11? Für sehr viele Plattformen gibts C++ (03) und das wars. Und genau diese Compiler sind dann oft auch nicht besonders gut im Optimieren. D.h. wenn ich performanten Code will, dann muss ich dies auch explizit ausprogrammieren und nicht hoffen dass der Compiler mir da hilft.



  • happystudent schrieb:

    Wenn ich eine Funktion mit const& Parameter sehe, dann erwarte ich dass die Funktion keine Kopie anlegt. Wenn dann trotzdem eine Kopie angelegt wird, fände ich das sehr verwirrend und unintuitiv.

    Ich erwarte hier gar nichts. Das sind für mich Implementierungsdetails, die sich ständig ändern können (und sich auch ständig ändern, ohne dass die Schnittstelle angepasst wird). Ich erwarte von der Schnittstelle, dass keine Kopie erstellt wird, wenn keine benötigt wird (deswegen die Referenz) und dass das reingegebene Objekt nicht verändert wird (deswegen const). Ob die Funktion jetzt grad doch eine Kopie benötigt, ist mir völlig egal.
    Das weiß man meist auch nicht. Eine Funktion kann viele ifs haben und Unterfunktionen aufrufen. Manche Codepfade brauchen eine Kopie, andere nicht. Wenn ich "Funktion" schreibe, muss ich die zwei Tage später vielleicht wieder umbauen, weil ich was ähnliches auch an einer anderen Stelle brauche und den Code deswegen rausziehe. Und ob dabei überall eine Kopie benötigt wird, ab und zu eine Kopie benötigt wird, oder nie eine Kopie benötigt wird, kann man ohne viel Aufwand überhaupt nicht nachvollziehen.
    Und ich rede nicht von kleinen Demoprogrämmchen, die man alleine schreibt, sondern von großer Software, die von dutzenden Mitarbeitern über Jahrzehnte entwickelt und gepflegt wird. Und ich geht stark davon aus, dass pass by valie insgesamt zu sehr viel mehr Kopien als nötig führen würde.



  • Mechanics schrieb:

    Das weiß man meist auch nicht. Eine Funktion kann viele ifs haben und Unterfunktionen aufrufen. Manche Codepfade brauchen eine Kopie, andere nicht.

    wobei man eine einzelne Funktion, die mit if-Kaskaden in Bildschirmbreite gespickt ist und vor Unterfunktionsaufrufen strotzt, vielleicht erst einmal besser faktorisieren sollte.



  • gdfgdfgd schrieb:

    zu 1: eine saubere Schnittstelle ist aber const& und nicht per-value. Wenn ich per-value bei Objekten sehe, denke ich mir: mmmh, hat da jemand vergessen const& zu verwenden. Wenn in der Funktion dann eine Kopie erzeugt wird, soll das so sein, ist mir als Anwender dieser Funktion egal.

    Da ist diese Behauptung schon wieder. Warum soll "by value" bitteschön eine weniger "saubere" Schnittstelle sein? Weil du "denkst" das da was fehlt ist kein wirklicher Grund.
    BTW.: Ich habe nie behauptet dass "by value" "sauberer" sein soll (was man auch immer darunter verstehen soll). Ich habe lediglich argumentiert, dass wenn man denn wirklich
    so spitzfindig sein will, "by value" eher das Attribut "sauber" zustünde.

    gdfgdfgd schrieb:

    zu 2: wer redet von C++11? Für sehr viele Plattformen gibts C++ (03) und das wars. Und genau diese Compiler sind dann oft auch nicht besonders gut im Optimieren.

    Ich werde mich nicht auf eine solche sich im Kreis drehende Diskussion einlassen, nur weil ich nicht besonders hervorgehoben habe, dass sich meine Aussage nicht auf Algol 48 bezieht,
    da diese Sprache keine Move-Konstruktoren kennt. Ich erwarte dass man diese Schlussfolgerung selbständig ziehen kann und in diesem Fall eine Referenz verwendet.

    gdfgdfgd schrieb:

    D.h. wenn ich performanten Code will, dann muss ich dies auch explizit ausprogrammieren und nicht hoffen dass der Compiler mir da hilft.

    Man muss zwar nicht jeden Kleinkram optimieren, aber man muss dem Compiler auch nicht unbedingt explizit ein Move verbieten, indem man ihn zwingt, ein rvalue an eine const&
    zu binden, von welcher er nicht moven darf. Auch hier: Diese Aussage bezieht sich auf modernes C++. Wenn du das nicht verwendest, darfst du das gerne über einen Output-Parameter o.ä.
    "explizit ausprogrammieren", oder was auch immer du für eine Technik anwendest, um die zusätlichen Kopien einzusparen - was du mit modernem C++ übirgens geschenkt bekommst,
    wenn du in diesem speziellen Fall "by value" übergibst.

    Finnegan



  • klassenmethode schrieb:

    Mechanics schrieb:

    Das weiß man meist auch nicht. Eine Funktion kann viele ifs haben und Unterfunktionen aufrufen. Manche Codepfade brauchen eine Kopie, andere nicht.

    wobei man eine einzelne Funktion, die mit if-Kaskaden in Bildschirmbreite gespickt ist und vor Unterfunktionsaufrufen strotzt, vielleicht erst einmal besser faktorisieren sollte.

    Du kannst überall reininterpretieren, was du willst. Und was ist, wenns nur ein if ist, reicht das nicht? Und sind Unterfunktionen kein Indiz dafür, dass die Funktion schon "besser faktorisiert" wurde und nicht alles selber macht?



  • Finnegan schrieb:

    gdfgdfgd schrieb:

    zu 1: eine saubere Schnittstelle ist aber const& und nicht per-value. Wenn ich per-value bei Objekten sehe, denke ich mir: mmmh, hat da jemand vergessen const& zu verwenden. Wenn in der Funktion dann eine Kopie erzeugt wird, soll das so sein, ist mir als Anwender dieser Funktion egal.

    Da ist diese Behauptung schon wieder. Warum soll "by value" bitteschön eine weniger "saubere" Schnittstelle sein? Weil du "denkst" das da was fehlt ist kein wirklicher Grund.
    BTW.: Ich habe nie behauptet dass "by value" "sauberer" sein soll (was man auch immer darunter verstehen soll). Ich habe lediglich argumentiert, dass wenn man denn wirklich
    so spitzfindig sein will, "by value" eher das Attribut "sauber" zustünde.

    gdfgdfgd schrieb:

    zu 2: wer redet von C++11? Für sehr viele Plattformen gibts C++ (03) und das wars. Und genau diese Compiler sind dann oft auch nicht besonders gut im Optimieren.

    Ich werde mich nicht auf eine solche sich im Kreis drehende Diskussion einlassen, nur weil ich nicht besonders hervorgehoben habe, dass sich meine Aussage nicht auf Algol 48 bezieht,
    da diese Sprache keine Move-Konstruktoren kennt. Ich erwarte dass man diese Schlussfolgerung selbständig ziehen kann und in diesem Fall eine Referenz verwendet.

    gdfgdfgd schrieb:

    D.h. wenn ich performanten Code will, dann muss ich dies auch explizit ausprogrammieren und nicht hoffen dass der Compiler mir da hilft.

    Man muss zwar nicht jeden Kleinkram optimieren, aber man muss dem Compiler auch nicht unbedingt explizit ein Move verbieten, indem man ihn zwingt, ein rvalue an eine const&
    zu binden, von welcher er nicht moven darf. Auch hier: Diese Aussage bezieht sich auf modernes C++. Wenn du das nicht verwendest, darfst du das gerne über einen Output-Parameter o.ä.
    "explizit ausprogrammieren", oder was auch immer du für eine Technik anwendest, um die zusätlichen Kopien einzusparen - was du mit modernem C++ übirgens geschenkt bekommst,
    wenn du in diesem speziellen Fall "by value" übergibst.

    Finnegan

    Wir werden es ohnehin nicht klären können, was "richtig" ist, weil beide Varianten funktionieren.
    Ich habe meine Meinung dargelegt, welche sich aus meiner Erfahrung mit nicht nur modernen Compilern ergibt und meiner Erfahrung mit typischen Fehlern in großen Codebasen ergibt: und da ist eine per-value Übergabe größerer Objekte nunmal oft nicht gewünscht gewesen (vom Ersteller dieser Codezeilen), weswegen ich bei per-value Übergaben erstmal genauer hinschaue, ggf. auch die Implementierung mir näher ansehe.



  • gdfgdfgd schrieb:

    Wir werden es ohnehin nicht klären können, was "richtig" ist, weil beide Varianten funktionieren.
    Ich habe meine Meinung dargelegt, welche sich aus meiner Erfahrung mit nicht nur modernen Compilern ergibt und meiner Erfahrung mit typischen Fehlern in großen Codebasen ergibt: und da ist eine per-value Übergabe größerer Objekte nunmal oft nicht gewünscht gewesen (vom Ersteller dieser Codezeilen), weswegen ich bei per-value Übergaben erstmal genauer hinschaue, ggf. auch die Implementierung mir näher ansehe.

    Eins ist auf jeden Fall klar: Wie fast immer gibt es keine einzige richtige Antwort 😃
    Es stimmt schon dass es immer Sonderfälle und jede Menge alten Code gibt, bei denen man mit einer anderen Strategie besser fährt.
    Der Grund, weshalb ich das "by value" hier so vehement verteidige ist, weil die vom Threadersteller gepostete Funktion gerade ein
    Paradebeispiel dafür ist, wie mit modernem C++ ausgerechnet die einfachste Lösung den besten Code generieren kann.
    Da schimmert ein wenig die wesentlich simplere Sprache durch, die laut Stroustrup irgendwie tief in C++ vergraben liegen soll.

    Ich möchte auch nochmal hervorheben, dass ich nicht sage, dass "by value" immer die erste Wahl sein sollte. Bloss nicht! Wie mehrfach erwähnt,
    bezieht sich das nur auf Funktionen die ohnehin eine Kopie des Objekts machen müssen, da sie in dessen Innereien herumwursteln.
    Hier kann man die Kopie auch genauso gut von einem Parameter-Konstruktor machen lassen und profitiert dabei noch zusätzlich,
    wenn die Funktion mit einem Temporary aufgerufen wird und die Klasse einen Move-Konstruktor hat - wenn nicht, auch egal, denn
    die Kopie wird ja sowieso benötigt. Dabei ist es dann auch egal, ob es teuer ist, das Objekt zu kopieren, denn, wer hätte es gedacht:
    die Kopie wird ja sowieso benötigt 😃

    Wird keine Kopie benötigt (Beispiel: Zähle die Buchstaben 'e' in String), dann ja, bitte! Immer gerne eine const& !

    Finnegan



  • Mechanics schrieb:

    klassenmethode schrieb:

    Mechanics schrieb:

    Das weiß man meist auch nicht. Eine Funktion kann viele ifs haben und Unterfunktionen aufrufen. Manche Codepfade brauchen eine Kopie, andere nicht.

    wobei man eine einzelne Funktion, die mit if-Kaskaden in Bildschirmbreite gespickt ist und vor Unterfunktionsaufrufen strotzt, vielleicht erst einmal besser faktorisieren sollte.

    Du kannst überall reininterpretieren, was du willst. Und was ist, wenns nur ein if ist, reicht das nicht? Und sind Unterfunktionen kein Indiz dafür, dass die Funktion schon "besser faktorisiert" wurde und nicht alles selber macht?

    viele Unterfunktionsaufrufe innerhalb einer Funktion sind für mich ein Zeichen, daß man noch weiter faktorisieren sollte.

    Aber mal allgemein: Ich finde schon, daß es guter Stil ist, wenn man einer Funktion auf Anhieb ansieht, ob für einen Argumenttyp irgendwo weiter drin z.B. ein copy constructor verwendet wird. const& als Argumenttyp ist für mich schon ein Indiz, daß ich mir üblicherweise keine Gedanken darüber machen muß.

    Aber meinetwegen kann natürlich jeder programmieren wie er will, Punkt. Ach nein, besser: Komma. Solange ich seinen Code nicht debuggen muß 😃



  • klassenmethode schrieb:

    viele Unterfunktionsaufrufe innerhalb einer Funktion sind für mich ein Zeichen, daß man noch weiter faktorisieren sollte.

    und weiter 'faktorisieren' heißt bei dir konkret was? Etwa funktionsaufrufe eliminieren und durch den funktionsinhalt ersetzen?!



  • na zum Beispiel so was:

    f();
    do_something();
    g();
    do_something_else();
    h() && i();
    

    ersetzen durch:

    f();
    do_some_things();
    
    void do_some_things(){
      do_something();
      g();
      k();
    }
    
    void k(){ 
      do_something_else();
      h() && i(); 
    }
    


  • Zur sauberen Schnittstelle:
    Für mich sind call-by-value und call-by-const-reference gleich sauber, beide haben keine Seiteneffekte (zumindest für den übergebenen Parameter). Und wenn jemand sagt, dass call-by-const-reference Aussagen über die Funktionsweise der Funktion macht, dann gilt das für call-by-value auch.

    Ganz konkret extrahiert die Funktion den Pfadanteil eines Dateipfades unter Windows. Weil Windows sowohl den Slash als auch den Backslash als Pfadtrennzeichen akzeptiert werden vorher alle Slashes durch Backslashes ersetzt. Das erfordert, dass irgendein string veränderbar sein muss. Um den übergebenen String zu bearbeiten gibt es jetzt die beiden Möglichkeiten, die ich oben angeboten habe.

    Ich bin für Variante 1, weil der Compiler beim pass-by-value entscheiden kann, ob und wann er eine Kopie anlegt oder ob er die Änderungen direkt in Zielvariable durchführt.

    string s = f( "c:\\path/path1\\path2/file.txt" );
    

    Variante 2 sieht für mich unnatürlich aus, weil offensichtlich klar ist, dass man mit dem per const-reference übergebenen Parameter nix anfangen kann und erst ein Mal ein Kopie erzeugen muss. Da ist die Schnittstelle eher im Weg, weil sie einen unpassenden Parametertyp anbietet.



  • Nur paar Überlegungen zu deinem Beispiel...

    1. Wenn du das in eine Basisbibliothek packst und eine Dll draus baust, kannst du vergessen, dass der Compiler irgendwas optimiert.
    2. Vielleicht wärs eine Optimierung, erstmal zu schauen, ob man überhaupt was ersetzen muss, bevor man eine Kopie macht. Drüberlaufen und schauen, ob ein Slash vorkommt, ist evtl. schneller, als jedesmal gleich eine Kopie zu erstellen. Wenn du gleich eine Kopie reinbekommst, geht die Optimierung schon mal nicht.
    3. Ein Kollege wird über den Code drüber schauen und sich denken, warum zum Geier wird da eine Kopie gemacht und was ersetzt, ich schau einfach beim Scannen, obs Slashes oder Backslashes sind und brauch überhaupt keine Kopie und keine Ersetzung. Passt aber die Schnittstelle nicht an.



  • Mechanics schrieb:

    1. Wenn du das in eine Basisbibliothek packst und eine Dll draus baust, kannst du vergessen, dass der Compiler irgendwas optimiert.

    Das stimmt zwar für Compiler-Optimierungen wie RVO, nicht jedoch für das Argument mit dem Move-Konstruktor.
    Ein "move" ist schliesslich eigentlich keine Compiler-Optimierung, sondern eine explizite Optimierung im Code der Klasse.
    Auch wenn f() eine DLL-Funktion ist, wird hier beim Aufruf von f("abc") eine Kopie gespart:

    string f(string s)
    {
       transform(s); // Keine Kopie: es wird direkt auf s gearbeitet.
       return s;     // 1. Move: Auch wenn hier bei einer DLL-Funktion kein NRVO (s ist alias für result) stattfinden kann,
                     //          so kann und wird der Compiler im Allgemeinen hier ein "return std::move(s)" generieren.
    }
    
    auto result = f("abc"); // 1. Kopie: char* wird im Konstruktor in std::string kopiert.
                            // 2. Move: Zuweisung nach result.
    

    Also: 1 Kopie, 2 Moves.

    vs.

    string f(const string& s)
    {
       string t = s; // 2. Kopie: von einer const& kann man nicht moven.
       transform(t); // s.o.
       return t;     // 1. Move: s.o.
    }
    
    auto result = f("abc"); // 1. Kopie: char* wird im Konstruktor in std::string kopiert.
                            // 2. Move: Zuweisung nach result.
    

    2 Kopien, 2 Moves. In diesem Fall fährt man mit "by value" besser. Auch in einer DLL-Funktion.

    Mechanics schrieb:

    2. Vielleicht wärs eine Optimierung, erstmal zu schauen, ob man überhaupt was ersetzen muss, bevor man eine Kopie macht. Drüberlaufen und schauen, ob ein Slash vorkommt, ist evtl. schneller, als jedesmal gleich eine Kopie zu erstellen. Wenn du gleich eine Kopie reinbekommst, geht die Optimierung schon mal nicht.

    Das sowieso. Der schnellste Code ist immer noch der, der nicht ausgeführt werden muss. In so einem Fall macht const& Sinn.

    Mechanics schrieb:

    3. Ein Kollege wird über den Code drüber schauen und sich denken, warum zum Geier wird da eine Kopie gemacht und was ersetzt, ich schau einfach beim Scannen, obs Slashes oder Backslashes sind und brauch überhaupt keine Kopie und keine Ersetzung. Passt aber die Schnittstelle nicht an.

    Das ist aber ein sehr pessimistiches Argument. Ich soll Code schreiben, von dem ich weiss, dass er für meine Lösung ineffizienter ist, nur weil er für eine andere hypothetische Lösung besser ist?
    Ich halte es für wahrscheinlicher dass entweder mein Code Sinn macht, oder mein Kollege das ordentlich umsetzt. Dass es alle Beteiligten verbocken würde ich als Sonderfall betrachten,
    für den man nicht unbedingt optimieren sollte (obwohl - wenn man sich so manchen Code aus der freien Wirtschaft so ansieht könnte es durchaus Sinn machen für solche Fälle zu programmieren :D)

    Finnegan



  • @Mechanics:
    Zu gucken, ob überhaupt eine Kopie gemacht werden muss, halte ich in diesem Fall für übertrieben. Wenn man das letzte Fitzelchen Performance braucht kann man das machen, aber ich bezweifle, dass diese Funktion ein Flaschenhals sein wird.
    Und, Hand auf´s Herz, wenn du eine to_lower_case Funktion schreibst guckst du auch nicht erst, ob überhaupt Großbuchstaben im string vorhanden sind, oder?



  • Ich habe nicht alles gelesen. Aber ist pass by const reference nicht immer schneller als pass by value, außer wenn der value in einen size_t passt?


Anmelden zum Antworten