Schnelles memcpy usw. gesucht
-
Um memcpy zu beschleunigen, sind wir von der bisherigen C-Version abgekommen und schlagen uns durch den Assembler-Dschungel:
-
Als ich mich letztes Mal damit beschäftigt habe, ist es durch die ganzen Assembler-Versuche nur langsamer geworden als die naive C-Variante (also ohne solche Sachen wie SSE ins Spiel zu bringen).
-
@taljeth: würdest du uns bitte deine letzte nicht-SSE-Variante offenbaren?
-
Von den Assemblerversuchen? Ich befürchte fast, diesen Code habe ich nicht mehr.
-
Wir sind momentan sehr zufrieden mit unserer Variante.
-
Seht euch hier mal die Soubroutines an:
http://www.agner.org/optimize/#asmlib
-
Wurden denn die Messungen gemacht, Takte gezählt, vorher - nachher? Wie sehen die Messergebnisse aus, könnt Ihr sie uns offenbaren?