OpenCL



  • Ich denke *kernel ist falsch. Steht so im Buch Programming Guide OpenCL drin. Sogar mehrmals.



  • Weiß jemand ob ich hier beide for schleifen parallelisien kann ?

    Da der Index der 2.Schleife von der ersten abhängt , tu ich mich etwas schwer.

    for(int i=0;i<dim;i++)
    	{
    
    	   for(int j =0 ; j<i;j++)
    	   {
    		  c[i]+= (l[i*dim+j] *c[j])*(-1);
    	   }
    
    	}
    


  • Die 1.Schleife bekomm ich locker weg.

    int i = get_global_id(0) ;
    

    Aber ich frag mich ob die 2.Schleife auch möglich wäre



  • blurry333 schrieb:

    Weiß jemand ob ich hier beide for schleifen parallelisien kann ?

    ich denke das ist nicht ohne weiteres moeglich da du hier:

    c[i]+= (l[i*dim+j] *c[j])*(-1);

    die resultate der vorherigen durchlaeufe fuer die naechsten durchlaeufe benutzt.

    du kannst die innere schleife verbessern, da alles auf c[i] schreibt, falls i grosse genug wird, koenntest du eine art parallel reduce machen.



  • Oder versteh ich das richtig. Der Parameter der Funktion

    get_global_id( int dimension)
    

    ist selbst schon eine Verschachtelung.

    get_global_id(0)  // 1.for schleife
    get_global_id(1)  // 2.for schleife
    

    Ich muss also gar nichts weiter machen?



  • Kann mir mal einer sagen was es genau bedeutet wenn man

    get_global_id(int dimension)
    

    mit verschiedenen Parametern aufruft ?

    get_global_id (0) liefert meines Wissens die ID des aktuellen Workitems. Aber was bedeutet 1 oder 2 als Parameter ??



  • Ich zitier hier mal aus einem Tutorial:

    OpenCL kernels are executed over an index space, which can be 1, 2 or 3 dimensional



  • Wie startest du denn deinen Kernel?



  • for(int i = 0;i<dim;i++)
    {
       for(int j=0;j<dim;j++)
    
        result[dim*i+j] = a[dim*i+j]+ b[dim*i+j];
    }
    

    so würde ich das in OpenCl machen:

    __kernel void meinkernel(__global float* a,_global float* b; __global float*    result,const int dim)
    {
      int i = get_global_id(0);
      int j = get_global_id(1);
    
    result[dim*i+j] = a[dim*i+j]+ b[dim*i+j];
    
    }
    

    Aber sobald mehr als eine Schleife fehlt mir das Verständnis da ich nicht mit dem Parameter von get_global_id() zurechkomme.



  • Ich erklärs mir jetzt so.

    Sagen wir haben 4 workitems.

    mache ich get_global_id(0) also eindimensional gibt es
    das workitem 0, workitem 1, workitem 2 und workitem 3.

    mache ich aber get_global_id(0) und get_global_id(1)
    dann gibt es das workitem[0][0], das workitem [0][1] , das workitem [0][2]
    und workitem [1][0], workitem[1][1] usw und so fort.

    Die Id ist eben dann 2-dimensional.

    Stimmt die ERklärung ??

    Dann müßte auch mein Code stimmen.



  • Lässt sich eine Matrizmultiplikation parallelisieren.

    for(int i = 0;i<dim1;i++)
    	{
    		for(int j =0 ; j<dim1;j++)
    		{
    			rechteseite[i]+=matrix[i*dim+j]*ergebnisvektor[j];
    		}
    
    	}
    


  • Mein Kernel Code schaut so aus. Aber irgendwas läuft schief 😞

    __kernel void ergebnis_kernel(const int dim, __global  float *mat,
                                                 __global  float *vektor,
    					     __global  float *rechteseite)
    {
        int i = get_global_id(0);
    	int j = get_global_id(1);
    
    	rechteseite[i]+=mat[i*dim+j]*vektor[j];
    }
    

Anmelden zum Antworten