Deutsch, Englisch, Französisch und Spanisch -> Unicode
-
Hallo,
ich bekomme die Tage eine UTF8 kodierte Datei in der Deutsche, Englische, Spanische und Französische Texte drinnen sind. Diese muss ich in meiner Anwendung einlesen.
Bei der Konvertierung in Ascii werden bei mir alle Unicode Zeichen verloren gehen.
Gibt es in diesen 4 Sprachen eigentlich Unicode Zeichen, oder kann ich darauf spekulieren, dass ich alle Zeichen ohne Probleme einlesen kann?
Arne
-
Fürs Spanische weiß ich es nicht, aber alle deutschen, englischen und französischen Zeichen sind in ASCII enthalten (wenn ich keins in meiner Tabelle übersehen hab).
-
Im ASCII-Code gibts doch noch nichteinmal die deutschen umlaute. Da sind auch keine Französischen oder spanischen sonderzeichen drin.
-
In den oberen 128 Zeichen bei latin1 schon.
/edit: da hab ich mich wohl dadurch verwirren lassen das ich auf der Konsole ä/ö/ü/ß... ausgeben kann
-
ASCII hat aber keine 128 bit, ASCII hat 7 bit, also 128 Zeichen, die oberen 128 Zeichen die du wahrscheinlich meinst gibts im ASCII Code nicht.
-
ja, standartmäßig hat ASCII 128 Zeichen, aber 128 kann jedes Btriebsystem selbst festlegen....
schau mal dahin, da sind die festlegungen von Dos Mac und co....
http://n.ethz.ch/student/stammt/doc/Allgemeines/Ascii.htmlAlso wie gesagt es gibt 256 Zeichen...
Gruß eXitus *edit: :xmas1: :edit*