RGB zu YCbCr

Fuchs aus dem Wald schrieb:

Also mein gesamt Projekt soll Dekodieren und Enkodieren. Also beides. Allerdings fange ich mit einem JPEG an. Also ich lese erst ein JPEG ein.
Wenn ihr wollte kann ich euch den Aufbau von dem JPEG zeigen. (Hier)

Gut. Dann weißt Du ja jetzt wie Du vorgehen musst

Fuchs aus dem Wald

Danke.

hustbaer

Fuchs aus dem Wald schrieb:

Vielen dank für die ganzen tollen antworten.

@Ethon du verwechselst mich nicht.

hustbaer schrieb:

Farbraum-Umwandlung kommt erst ganz zum Schluss.

Erst musst du mal das JPEG-File-Format parsen, und dir die einzelnen Informationsstücke zusammensuchen.
Dann kannst du mal anfangen die Bilddaten zu dekomprimieren.
D.h. - wenn ich es richtig im Kopf habe - erstmal Huffman dekodierung, dann zig-zag Scan, Multiplikation mit dem Quantizer und dann inverse DCT. Und das halt für jeden Block.

DANN erst hast du ein Bild im YUV Format vorliegen. Und das kannst du dann nach RGB konvertieren.

Wenn du dich schon seit 3 Monaten damit beschäftigst solltest du das aber alles längst wissen.

Ja das sagt mir auch alles was, hab auch schon einiges davon umgesetzt. Nur das einzige was ich halt noch nicht ganz verstanden hatte war das mit dem Farbraum.

Du hast davon - wie aus deinen folgenden Antworten ersichtlich ist - anscheinend nicht viel verstanden und sicher noch nichts umgesetzt.

BTW: einen Punkt hab ich vergessen: Chroma-Subsampling.
Bei den meisten JPEGs sind die Farbkanäle mit der halben horizontalen und der halben vertikalen Auflösung abgespeichert.
D.h. man muss erstmal die Farbkanäle auf volle Auflösung aufblasen bevor man dann YUV -> RGB rechnen kann.

Fang doch erstmal damit an dir die passenden Blöcke zu suchen, und lies dir die Beschreibung dieser Blöcke durch. Und dann implementier die nötigen Transformationen Schritt für Schritt.

Und google dir ein paar zusätzliche Quellen. Gibt genug Informationen zum Aufbau von JPEGs im Internet.

Fuchs aus dem Wald

hustbaer schrieb:

Fang doch erstmal damit an dir die passenden Blöcke zu suchen, und lies dir die Beschreibung dieser Blöcke durch. Und dann implementier die nötigen Transformationen Schritt für Schritt.

Und google dir ein paar zusätzliche Quellen. Gibt genug Informationen zum Aufbau von JPEGs im Internet.

Ich hab das JPEG schon in einem vector und die einzelnen Blöcke (SOS, DQT, DHT...)mir gesucht. Ich hab auch schon die Tabellen raus geschrieben und Huffman gemacht. Und durch die Infos hier weiß ich jetzt was ich machen muss.

Danke dafür.

hustbaer

OK, cool.

Lass uns wissen wie du vorankommst.

Fuchs aus dem Wald

Hab mir jetzt mal ein vernünftigen Ablauf aufgeschrieben.

Schaut drüber und korrigiert mich wenn es falsch ist.

Ablauf

hustbaer

Chroma-Kanäle aufblasen (Chroma-Subsampling entfernen) fehlt noch.
Ansonsten: ich bin jetzt auch nicht der grosse JPEG Experte. Ich weiss gerade ein wenig darüber wie ein JPEG File ca. aufgebaut ist, implementiert hab ich es selbst auch noch nie.

Ob deine Liste genau passt kann ich dir also auch nicht sagen. Nach meinem Kenntnisstand beurteilt würde ich aber sagen: sieht gut aus.

Fuchs aus dem Wald

hustbaer schrieb:

Chroma-Kanäle aufblasen (Chroma-Subsampling entfernen) fehlt noch.

Ist doch Punkt 3.
Chroma-Subsampling ist Farbunterabtastung. Und in Punkt drei schaue ich welches Abtastformat benutzt wurde.
EDIT:
D.h. wenn ich 4:2:0 habe habe ich 4 Y-8x8-Blöcke und jeweils ein Cb-8x8-Block und ein Cr-8x8-Block. Die sind auch genau in der Reihenfolge Codiert. D.h. eine ich sag mal "Einheit" hat dann 6 8x8-Blöcke.

Fuchs aus dem Wald

Mal eine Frage:
Die Quantisierung-Tabelle steht die im Zick-Zack da oder kann ich die einfach so weg schreiben, also einfach in ein 2-Dim. Array?
Stehen tut sie ja ab dem Marker FF DB.

hustbaer

Wie gesagt, ich auch kein JPEG Experte, so genau kann ich dir das auch nicht sagen.
Und ... ähäm ... "Farbunterabtastung", ja, wenn ich das hätte lesen können hätt ich's vermutlich verstanden

Wie die einzelnen Blöcke der Farbkanäle angeordnet sind weiss ich nicht. Im Prinzip kannst du aber erstmal jeden Kanal einzeln dekodieren, und dann den kompletten Kanal mit voller Grösse aufblasen.
(EDIT: gibt beide Varianten, entweder alle Blöcke eines Kanals hintereinander und dann erst der nächste Kanal, oder auch "interleaved".)

Ich weiss nicht ob der JPEG Standard einen Filter zum Aufblasen definiert, bzw. definiert ob man die Blöcke einzeln aufblasen soll oder das Bild als ganzes. Wenn ja, dann halte dich am besten an diese Vorgaben.
(EDIT: sieht so aus als ob der Standard keinen Filter definiert.)

Wenn nein, dann würde ich empfehlen das Aufblasen erst mit dem ganzen Bild zu machen (vor bzw. gleichzeitig mit der YUV->RGB Konvertierung), weil es vermutlich zu nem besseren Ergebnis führen wird. Wenn du nämlich die einzelnen Blöcke aufskalierst, dann musst du entweder einen suboptimalen Vergrösserungsfilter verwenden (nearest pixel oder linear interpolieren), oder du bekommst Fehler an den Blockrändern -- weil du dort die von besseren Filtern (bikubisch, ...) benötigen Nachbarpixel nicht zur Verfügung hast. Diese Fehler würden sich dann wie ein Gitter durch das ganze Bild ziehen. Bei Bildern mit starken Farbübergängen (roter Text auf Schwarz, grüner Text auf Rot o.ä.) würde das ziemlich sicher auch auffallen.

Wie die Quantisierungs-Matrix abgelegt ist weiss ich ehrlich gesagt auch nicht. Ich würde vermuten ohne zig-zag. Kannst du aber einfach an den Werten erkennen: wenn sie halbwegs von klein nach gross sortiert sind, dann ist es mit zigzag. Wenn sie dagegen eher ne Sägezahnkurve ergeben, dann ist es ohne zigzag.

Oder du suchst dir die fehlenden Infos aus den entsprechenden Standarddokumenten raus:
http://www.w3.org/Graphics/JPEG/itu-t81.pdf
http://www.w3.org/Graphics/JPEG/jfif3.pdf

Fuchs aus dem Wald

Hey hustbaer,
vielen dank für deinen Beitrag! Sehr hilfreich!

Ich schau mir das gleich mal und danke für die 2 Links die hatte ich noch nicht.

Ich meld mich dann Donnerstag wieder hab jetzt erstmal Feierabend!

Schönen 1. Mai euch!

hustbaer

Fuchs aus dem Wald schrieb:

Ich schau mir das gleich mal und danke für die 2 Links die hatte ich noch nicht.

Sind beide auf der (englischen) Wikipedia-Seite zu JPEG zu finden

http://en.wikipedia.org/wiki/JPEG

Tip: Browser umstellen dass er Englisch als erste Sprache meldet und Google umstellen dass google.com verwendet wird und "Google-Anwendungen" auch per Default Englisch laufen.
Bringt eine deutliche Verbesserung der Suchresultate bei fast allen Themen, und sorgt bei einigen Seiten dafür dass man nicht per Default auf die (meist minderwertige) Deutsche Seite umgeleitet wird. (Bzw. bei MSDN per Default die (meist minderwertige) Deutsche Sprachversion presentiert bekommt.)

Ausgenommen natürlich wenn man nach Deutsch-spezifischen Dingen sucht. Wobei Google schlau genug zu sein scheint mir trotzdem nicht nur lauter amerikanische Online Shops zu liefern wenn ich nach Produkten suche.

hustbaer schrieb:

Tip: Browser umstellen dass er Englisch als erste Sprache meldet

Gute Idee, habe ich auch schonmal versucht... nutze Firefox, und es wollte nicht klappen. Falls du auch Firefox nutzt, wie macht man das? Ich habe z.B. in \1:config Language auf en-us umgestellt, hat aber net so viel gebracht.

out schrieb:

... nutze Firefox, und es wollte nicht klappen.

http://www.google.com/ncr

ncr schrieb:

out schrieb:

... nutze Firefox, und es wollte nicht klappen.

http://www.google.com/ncr

Wie einfach Dinge doch sein können... 3 Buchstaben.

Danke dir

hustbaer

@out
Geht noch viel einfacher.
Geh auf google.de, und klick einfach 1x auf den "Google.com" Link ganz rechts unten. Dann merkt er sich dass du wirklich google.com willst wenn du google.com eingibst. => done

Das Umstellen der Sprache die der Browser reportet ist dann für andere Seiten die anhand der primären Sprache entscheiden ob sie umleiten bzw. einen mit einer Maschinenübersetzung nerven sollen. Wie eben z.B. MSDN.

Fuchs aus dem Wald

Den Tipp sollte man irgendwo mit rein Pinnen! Das ist richtig gut.

Fuchs aus dem Wald

OK da bin ich mal wieder mit meinem Fortschritt.

Mein Problem ist grade, wie ich diese Rechnung hier umsetzen kann.

Formel
Ich bräuchte da mal einen Tipp wie man sowas in Code schreiben könnte.

SeppJ

Schleifen?

Fuchs aus dem Wald

Fuchs aus dem Wald schrieb:

Mal eine Frage:
Die Quantisierung-Tabelle steht die im Zick-Zack da oder kann ich die einfach so weg schreiben, also einfach in ein 2-Dim. Array?
Stehen tut sie ja ab dem Marker FF DB.

Hey ich möchte noch einmal auf diese Frage zurück kommen. Da die Tabelle schon im Zick-Zack geschrieben werden muss.
Ich weiß nicht so richtig wie ich das Programmieren soll. Das macht mir im Moment am meisten Probleme.
Das hier habe ich jetzt dafür aber irgendwie gefällt mir das nicht. -.- Das geht doch sicher irgendwie einfacher.

int x  = 0;
 int y  = 0;
 int up = -1;
 const char* arr;
 Matrix[x][y] = dqt; //da x,y = 0 ist das der erste punkt also der DC 
                     //dgt ist eine Pointer auf den anfang
 while(x <= 7 && y <=7){
   if(x == 0 || y == 0 || x == 7 || y == 7){ 
     if(x == 0 || x == 7){
       ++y;
     }
     if(y == 0 || y == 7){
       ++x;
     }
     arr = Matrix[x][y];
     objectstorage->setHuffMatrix(arr);
     up = -1;
   }
   x = up;
   y = up;
   arr = Matrix[x][y];
   objectstorage->setHuffMatrix(arr);
 }
}