Nur aus Interesse: Was für einen Compiler/Toolchain verwendest du bzw. wie kompilierst du den CUDA Code? Das Problem hier war nicht das sizeof(int) (wie rapso schon gesagt hat, ist das momentan nur ein theoretisches Problem, da es in der Praxis kein von CUDA supportetes System gibt, wo eine entsprechende Konfiguration anzutreffen wäre, imo sollte man sich dessen aber zumindest bewusst sein), sondern dass deine CPU Seite wohl für 32-Bit kompiliert wurde und CUdeviceptr daher auch nur 32-Bit war, dein GPU Code aber 64-Bit Pointer erwartet hat. Effektiv wurden dadurch wohl auf GPU Seite zwei Pointerargumente zu einem zusammengeklebt und der resultierende Pointer zeigte natürlich ins Nirvana...