Zeiger in C
-
@Peter-Viehweger Ich habe dir oben zitiert was der Standard sagt. Punkt.
Und zu deiner mein-compiler-meckert-nicht-Theorie:
Swordfish@Neptune:/mnt/c/Users/Swordfish> tail foo.c #include <stdio.h> int main(void) { float pi = 3.1415f; printf("%p\n", &pi); } Swordfish@Neptune:/mnt/c/Users/Swordfish> gcc -Wall -Wextra -pedantic-errors foo.c -o foo foo.c: In function ‘main’: foo.c:6:11: warning: format ‘%p’ expects argument of type ‘void *’, but argument 2 has type ‘float *’ [-Wformat=] printf("%p\n", &pi); ~^ ~~~ Swordfish@Neptune:/mnt/c/Users/Swordfish> clang -Wall -Wextra -pedantic foo.c -o foo foo.c:6:17: warning: format specifies type 'void *' but the argument has type 'float *' [-Wformat-pedantic] printf("%p\n", &pi); ~~ ^~~ 1 warning generated. Swordfish@Neptune:/mnt/c/Users/Swordfish>
-
@Swordfish sagte in Zeiger in C:
@john-0 Ein cast hätt's auch getan.
Ich caste nicht, wenn es ohne geht, weil Casts schnell echte Fehler verdecken.
Nachtrag @Peter-Viehweger: Ich habe die beiden Programme mit
gcc -std=c11 -pedantic -Wall -Wextra
übersetzt, der Unterschied zu C17 ist gering, da die Änderungen auch in der C11 Version eingepflegt wurden, d.h. auch mit-std=c17
wird das Programm gleich übersetzt.
-
Ja man kann immer Warnungen aus dem Compiler "herauskitzeln". Die Warnung wird aber nur deshalb ausgegeben, weil mit -pedantic auf Standardkonformität geprüft wird und der Standard - wie du bereits erläutert hast - besagt, dass an printf beim Spezifizierer "%p" ein "void *" übergeben werden sollte. Das ist aber auch der einzige Grund.
Hier gibt es keine Warnung, obwohl dort ja auch ein "float *" übergeben wird, wo "void *" erwartet wird:
#include <unistd.h> #include <fcntl.h> int main() { float f; int fd; int n; int rc; fd = open("/dev/random", O_RDONLY); if(fd == -1) { return 1; } n = read(fd, &f, sizeof(f)); if(n != sizeof(f)) { return 1; } rc = close(fd); if(rc == -1) { return 1; } return 0; }
[root@FreeBSD ~]# cc -o main -Wall -Wextra -pedantic main.c [root@FreeBSD ~]# gcc -o main -Wall -Wextra -pedantic main.c [root@FreeBSD ~]#
Muss ja eigentlich auch so sein, oder?
-
@john-0 Ja aber du führst den impliziten Cast in Zeile 5 durch und hast eigentlich nichts dadurch gewonnen. Diese Regel nur Zeiger auf void zu übergeben kann man eigentlich echt streichen und deshalb gibt es da auch nur eine Warnung, die auch noch mit pedantic rausgeholt werden muss.
-
@Peter-Viehweger sagte in Zeiger in C:
@john-0 Ja aber du führst den impliziten Cast in Zeile 5 durch
Nein, das ist eine Zuweisung und eben kein Cast. Insbesondere C Casts sind ein großes Problem, weil man da ganz schnell vollkommen inkompatibel Dinge einander zuweisen kann.
#include <stdio.h> #include <stdlib.h> int main () { size_t size = 10000; printf ("%p\n", (void*)size); return EXIT_SUCCESS; }
-
@john-0 https://de.wikibooks.org/wiki/C-Programmierung:_Typumwandlung
Das gilt nicht nur für int und float, sondern auch für void * und float *
-
@Peter-Viehweger Es geht darum, dass man so programmiert, dass Programme unabhängig vom verwendeten Compiler bzw. der Compilerversion sich übersetzen lassen. D.h. normkonforme Programme werden auch in Zukunft mit hoher Wahrscheinlichkeit ohne Änderungen übersetzbar bleiben und das gleiche Verhalten aufweisen. Wenn man anfängt irgend eine ähnliche Sprache wie in der betreffenden Norm zu verwenden läuft man Gefahr, dass dies in Zukunft nicht mehr der Fall sein wird. Mich ärgert das, dass Compiler nicht gleich mit allen Flags aktiviert übersetzen, und man diese explizit anschalten muss. Sinnvoller wäre es, dass man die Normprüfung mit Flags stufenweise abschalten kann.
Zu dem konkreten Verhalten in C: Natürlich findet an dieser Stelle eine Zuweisung mit Typumwandlung statt, aber es war noch nie eine gute Idee hier entweder auf einen Casts zu setzen (das hebelt die Typprüfung faktisch aus) oder einfach so zu tun, als ob die Formatstringprüfung eine lästige Petitesse wäre. Es gibt Exploits die Formatstringfehler ausnutzen, und deshalb ist so extrem wichtig hier diese Fehlermeldungen eben nicht zu ignorieren.
-
@Peter-Viehweger sagte in Zeiger in C:
Ja man kann immer Warnungen aus dem Compiler "herauskitzeln". Die Warnung wird aber nur deshalb ausgegeben, weil mit -pedantic auf Standardkonformität geprüft wird und der Standard - wie du bereits erläutert hast - besagt, dass an printf beim Spezifizierer "%p" ein "void *" übergeben werden sollte. Das ist aber auch der einzige Grund.
Du bist hier im C-Forum. Im Standard-C-Forum.
@Peter-Viehweger sagte in Zeiger in C:
n = read(fd, &f, sizeof(f));
@Peter-Viehweger sagte in Zeiger in C:
Muss ja eigentlich auch so sein, oder?
Das ist ja auch keine Funktion mit einer Ellipse.
ISO/IEC 9899:202x (E) § 6.5.2.2/7:
If the expression that denotes the called function has a type that does include a prototype, the arguments are implicitly converted, as if by assignment, to the types of the corresponding parameters, taking the type of each parameter to be the unqualified version of its declared type. [...]
-
@Peter-Viehweger
Es macht einen Unterschied ob du etwas an eine "normale" Funktion oder an eine "varargs" Funktion (so eine mit ", ...") im "varargs" Teil übergibst.Bei der Übergabe an eine normale Funktion wird z.B. auch eine Konvertierung
long
->int
oderlong long
->int
implizit durchgeführt.Bei der Übergabe im varargs Teil nicht. Und das kann dann zu echten Fehlern führen.
Beispiel:#include <stdio.h> void int_fun(int i) {} int main() { long long ll = 42; int_fun(ll); // OK printf("%d, %d\n", ll, ll); // falsch return 0; } // Übliche Ausgabe auf 32 Bit Systemen: 42, 0
Da braucht man dann auch kein
-pedantic
mehr um eine Warning zu bekommen.<source>:10:11: warning: format '%d' expects argument of type 'int', but argument 2 has type 'long long int' [-Wformat=] 10 | printf("%d, %d\n", ll, ll); | ~^ ~~ | | | | int long long int | %lld <source>:10:15: warning: format '%d' expects argument of type 'int', but argument 3 has type 'long long int' [-Wformat=] 10 | printf("%d, %d\n", ll, ll); | ~^ ~~ | | | | int long long int | %lld
%p
und nicht-void Zeiger ist hier ein Sonderfall, weil die Repräsentation von Zeigern im Speicher bzw. Registern üblicherweise für alle Zeiger gleich ist. D.h. es wird üblicherweise "trotzdem funktionieren". Das weiss der Compiler, und daher gibt er dir nur eine Warning mit-pedantic
. Das heisst aber nicht dass es richtig ist.
-
@Peter-Viehweger sagte in Zeiger in C:
Ja man kann immer Warnungen aus dem Compiler "herauskitzeln". Die Warnung wird aber nur deshalb ausgegeben, weil mit -pedantic auf Standardkonformität geprüft wird und der Standard - wie du bereits erläutert hast - besagt, dass an printf beim Spezifizierer "%p" ein "void *" übergeben werden sollte. Das ist aber auch der einzige Grund.
Den muss ich mir merken. "Aaaaber...es gibt nur warnungen wenn man sie auch anmacht!!11"
-
@hustbaer sagte in Zeiger in C:
Da braucht man dann auch kein
-pedantic
mehr um eine Warning zu bekommen.
[...]
%p
und nicht-void Zeiger ist hier ein Sonderfall, weil die Repräsentation von Zeigern im Speicher bzw. Registern üblicherweise für alle Zeiger gleich ist. D.h. es wird üblicherweise "trotzdem funktionieren". Das weiss der Compiler, und daher gibt er dir nur eine Warning mit-pedantic
. Das heisst aber nicht dass es richtig ist.Das weiß nicht nur der Compiler, sondern ich auch. Deshalb habe ich ja gesagt, dass es eigentlich Unsinn darstellt und den Code aufpustet, wenn vorher noch nach void umgewandelt wird.
@Cardiac sagte in Zeiger in C:
Den muss ich mir merken. "Aaaaber...es gibt nur warnungen wenn man sie auch anmacht!!11"
Warnungen gibt es auch, wenn man kein -pedantic übergibt, nur die, dass man vorher doch bitte den Zeiger nach void * umwandeln soll, eben nicht......
-
@Peter-Viehweger sagte in Zeiger in C:
Das weiß nicht nur der Compiler, sondern ich auch.
Also erstmal würde ich behaupten dass du viel weniger weisst als du meinst zu wissen. Du hast ja selbst in diesem Thread schon demonstriert dass du eben nicht weisst was bei varargs Funktionen passiert. Siehe
@Peter-Viehweger sagte in Zeiger in C:
Der Compiler führt aber den impliziten Cast zu "void *" aus, weshalb so etwas nur unnötig den Code aufpustet.
...
@Peter-Viehweger sagte in Zeiger in C:
Deshalb habe ich ja gesagt, dass es eigentlich Unsinn darstellt und den Code aufpustet, wenn vorher noch nach void umgewandelt wird.
Äh... nein. Klingt für mich eher so als ob du da was falsch verstanden gehabt hättest und es jetzt im Nachhinein schönreden willst. Denn es passiert eben genau kein impliziter Cast, es wird lediglich das Bitmuster vom
float*
alsvoid*
interpretiert. Das ist kein Cast sondern ehermemcpy
. Und wie schon geschrieben wurde eben UB.
Und dann ist halt die Frage ob es gut ist sich auf "funktioniert trotzdem" bei undefiniertem Verhalten zu verlassen. Speziell wenn der einzige Vorteil davon ist dass man einen kleinen (laut Sprachstandard nötigen!) Cast nicht schreiben muss. Das macht mMn. keinen Sinn - sollte man sich nicht angewöhnen.
-
@hustbaer Du hast recht: Ich müsste jetzt im Internet nachlesen, wie das mit den varargs genau funktioniert, weil ich so etwas eigentlich nie benutzt habe, außer eben bei printf und scanf. Wenn ich mich aber richtig erinnere, müssen der Funktion "irgendwie" die Anzahl der Argumente und die jeweilige Größe bekannt gemacht werden.
Prüfungsfrage: Worin besteht bei Zeigern der Unterschied zwischen einem Cast und einer Uminterpretation des Bitmusters?
-
@Peter-Viehweger sagte in Zeiger in C:
Wenn ich mich aber richtig erinnere, müssen der Funktion "irgendwie" die Anzahl der Argumente und die jeweilige Größe bekannt gemacht werden.
Das erfolgt über das erste Argument– dem Formatstring! Deshalb ist es ja so wichtig, da nicht sinnfreie Aktionen durchzuführen und entweder zu casten (es besteht die Gefahr etwas Falsches zu übergeben) oder Warnungen zu ignorieren.
Nachtrag: Ein Beispiel mit funktionierendem Code, was verdeutlicht wie man in C mit Parameter Ellipsen arbeitet.
#include <stdarg.h> #include <stdlib.h> #include <stdio.h> int add_values (size_t num_arguments, ...) { int sum = 0, a = 0; va_list list_pointer; va_start (list_pointer, num_arguments); for (size_t i = 0; i < num_arguments; ++i) { a = va_arg(list_pointer, int); sum += a; } va_end(list_pointer); return sum; } int main () { int a = 1, b = 2, c = 3, d = 4, e = 5, f = 6, g = 7, h = 8; printf ("%i\n", add_values(3, a, b, c)); printf ("%i\n", add_values(8, a, b, c, d, e, f, g, h)); return EXIT_SUCCESS; }
-
@Peter-Viehweger sagte in Zeiger in C:
Worin besteht bei Zeigern der Unterschied zwischen einem Cast und einer Uminterpretation des Bitmusters?
Du versuchst also seit X Beiträgen gegen etwas zu argumentieren was du nicht verstehst. Gratuliere.
-
@Swordfish Vielleicht solltest du die Frage dann einfach einmal beantworten, anstatt mir ständig zu erzählen zu erzählen, wie ahnungslos ich bin.
-
#include <limits.h> #include <memory.h> #include <assert.h> #include <stdio.h> void print_bits(void *value, size_t size) { for (size_t byte = size; byte; --byte) { for (size_t bit = CHAR_BIT; bit; --bit) { printf("%d", (((char*)value)[byte - 1] & (1 << (bit - 1))) != 0); } } } int main(void) { assert(sizeof(int) == sizeof(float)); int foo = 1234567; float bar = foo; // implicit typecast printf("%i %f\n", foo, bar); print_bits(&foo, sizeof(foo)); putchar('\n'); print_bits(&bar, sizeof(bar)); putchar('\n'); memcpy(&bar, &foo, sizeof foo); // reinterpretation of bit pattern printf("%i %f\n", foo, bar); print_bits(&foo, sizeof(foo)); putchar('\n'); print_bits(&bar, sizeof(bar)); putchar('\n'); }
-
@Peter-Viehweger sagte in Zeiger in C:
@hustbaer Du hast recht: Ich müsste jetzt im Internet nachlesen, wie das mit den varargs genau funktioniert, weil ich so etwas eigentlich nie benutzt habe, außer eben bei printf und scanf. Wenn ich mich aber richtig erinnere, müssen der Funktion "irgendwie" die Anzahl der Argumente und die jeweilige Größe bekannt gemacht werden.
Ja, die Funktion muss das irgendwie wissen wenn sie wirklich auf die Parameter zugreifen will. Allerdings hilft ihr niemand dabei. Für die Funktion gibt es keinen Weg das herauszufinden, es sei denn sie erfindet selbst irgend ein "Protokoll" und schreibt dem Aufrufer vor sich genau an dieses zu halten. Die
...f
Funktionen verwenden dazu den Format-String und daher muss man auch exakt zum Format-String passende Parameter (Anzahl und Typ) übergeben.
Andere Funktionen in anderen Libraries verwenden andere Protokolle. Auf AmigaOS gibt es z.B. die...Tags
Funktionen die eine Key-Value Liste erwarten. Dabei wird immer abwechselnd Key und Value übergeben, so lange bis ein spezieller Wert als Key auftaucht der das Ende signalisiert. Die Keys sind dabei immerunsigned long
und der Typ der Value hängt dann vom Key ab. Wenn der Aufrufer sich an das vorgeschriebene Muster hält, kann die Funktion dabei ebenso die genaue Anzahl und Typen der Parameter rekonstruieren.Prüfungsfrage: Worin besteht bei Zeigern der Unterschied zwischen einem Cast und einer Uminterpretation des Bitmusters?
Unterschiedliche Zeiger-Typen dürfen laut Standard unterschiedliche Repräsentation (im Speicher bzw. auch Registern) haben. Also z.B. auch schonmal unterschiedliche Grösse. Manche Maschinen können nur 2- oder 4-Byte Worte adressieren. D.h. für einen
char
Zeiger sind dort zwei Werte nötig - die Adresse (welche die Wort-Nummer angibt) und z.B. die Byte-bzw. Bit-Nummer innerhalb des Wortes wo derchar
anfängt. Einint
Zeiger kommt allerdings mit einem einzigen Wert aus - einfach nur die Wort-Adresse.char
undint
Zeiger wären dann sehr unterschiedlich aufgebaut. Einvoid
Zeiger ist auf solchen Systemen immer so aufgebaut dass er sämtliche Adressen transportieren kann, also üblicherweise gleich wie einchar
Zeiger.Wenn du jetzt einen Cast verwendest, dann garantiert dir die Sprache dass das ganze passend konvertiert wird, so dass das Ergebnis auf die selbe Adresse verweist wie der ursprüngliche Zeiger. Vorausgesetzt die Adresse ist im neuen Zeigertyp darstellbar.
Wenn du dagegen
memcpy
oder einen Varargs-Zugriff verwendest dann werden eben einfach die Bits kopiert. Wobei dann schonmal das erste Problem ist dass die Zeiger nicht gleich gross sind. Bei einem Varargs-Zugriff wo die Funktion den grösseren Zeigertyp erwartet aber der kleinere übergeben wurde, werden also zusätzliche Bits gelesen die gar nicht übergeben wurden. Das kann dann- Das Ergebnis verändern
- Alle folgenden Zugriffe verschieben, d.h. bei denen kommt dann auch nur mehr Mist raus
- Zu einem Crash führen
- ...
Auf Systemen wo alle Zeiger gleich aufgebaut sind entspricht ein Cast dagegen normalerweise dem Uminterpretieren der Bits. D.h. in dem Fall gäbe es keinen Unterschied. Nur macht es keinen Sinn sich darauf zu verlassen bloss damit man einen Cast nicht schreiben muss.
C und C++ haben viele solche Regeln die man meistens nicht braucht. Und wenn man sie alle ignoriert, dann hat man relativ schnell ein Programm welches sich auf bestimmte reale Systeme nicht mehr portieren lässt - oder nur mit riesigem Aufwand. Und wenn so ein System dann auf einmal relevant wird, dann weint man.
Es gibt jetzt sicher schlimmeres als bei
%p
nicht zu casten. Aber zu behaupten es wäre richtig bzw. völlig egal ist falsch. Es ist weder richtig noch ist es völlig egal.
-
@hustbaer sagte in Zeiger in C:
Unterschiedliche Zeiger-Typen dürfen laut Standard unterschiedliche Repräsentation (im Speicher bzw. auch Registern) haben. Also z.B. auch schonmal unterschiedliche Grösse.
Die klassischen 8Bit Systeme wurden sobald die Speichergröße 64kB erreichten mit Bank Switching in unterschiedliche Banks aufgeteilt, die man nach und nach durch Umschalten spezieller Register in der CPU oder durch Schreiben auf magische Adressen umschalten konnte. Diese Computer wurden in der Regel noch nicht mit Hochsprachen wie etwa C programmiert, sondern meistens in Assembler. Zeiger sind auf diesen Plattformen 16Bit groß, die Informationen für das Bank Swiching musste selbst verwaltet werden.
Auf 16Bit Systemen kamen dann die ersten Hochsprachen auf, z.B. C auf der DEC PDP-11 mit Hilfe dessen die Portierung von UNIX auf diese Maschine vereinfacht wurde. Für Anwendungen blieb die PDP-11 immer bei 16Bit, aber das System konnte mehrere solcher Programme parallel betreiben. Bei den 16Bit Systemen gab es dann auf diversen Plattformen Erweiterungen der 16Bit Adressregister, weil 64kB Adressraum auf den meisten kommerziellen Systemen viel zu klein war. Die bekannteste Krücke dürfte Intels 8088 im ersten IBM PC gewesen sein. Hier wird 16+4 Bit Adressierung genutzt, und es gibt spezielle Pointer (near und far) für die jeweiligen Adressierung, d.h. man kann die beiden Typen nicht einfach ineinander konvertieren. Das alles wäre nur vom historischem Interesse, wenn es nicht noch immer Microcontroller mit ganz ähnlichen Macken gäbe. Womit sich der Kreis zu aktuellem C wieder schließt.
-
@hustbaer sagte in Zeiger in C:
C und C++ haben viele solche Regeln die man meistens nicht braucht. Und wenn man sie alle ignoriert, dann hat man relativ schnell ein Programm welches sich auf bestimmte reale Systeme nicht mehr portieren lässt - oder nur mit riesigem Aufwand. Und wenn so ein System dann auf einmal relevant wird, dann weint man.
DAS! Also auf einen cast zu verzichten der in den meisten Fällten in einer NOP resultiert nur um sagen zu können "Ich bin viel schlauer als der Compiler" doesn't quite cut it.