Regulärer Ausdruck für ISO/IEC 8859-1
-
Hi!
Ich suche einen Regulären ausdruck um zu prüfen ob ein String "ISO/IEC 8859-1"-Komform ist. Bei google finde ich jedoch nichts in der Richtung. Eher nur äüö zu ersetzen und so dirty kram halt, wo mal ein china-Zeichen antanzen muss und das ganze System brennt.
Kennt da jemand einen Regex?
-
Dafür würde ich keine Regex bemühen, die Prüfung ist doch recht einfach: Ungültig sind alle, die im oberen Nibble 0, 1, 8 oder 9 haben, sowie 7f.
-
hmn? also ne For-Schleife und gut? Sieht aber dirty aus
-
Was ist daran "dirty"? Jedes Byte repräsentiert genau ein Zeichen, also kannst du auch einfach Byte für Byte prüfen.
-
Also wirklich, sowas ist doch nun echt tiefster C-Style und kein Zeichen von qualitativ hochwertiger Software - Vorallem, kann ich es nur sehr schlecht erweitern, warten usw. Wenn jetzt nächsten Monat ein Kunde antanzt und möchte nun die Prüfung für einen anderen Zeichensatz, tja super, steh ich da blöd.
Drum frag ich ja, ob es für die ISOs vorgefertigte Regex gibt, die man schnell austauschen kann.
Sowas wird doch nun echt nicht mehr gemacht, ist doch mehr als grottig! Pfui:
String strValue = "hallo du da"; for (int i = 0; i < strValue.length(); ++i) { if (strValue[i] == /*irgendwas*/) return (false); }
-
Javerianer schrieb:
Drum frag ich ja, ob es für die ISOs vorgefertigte Regex gibt, die man schnell austauschen kann.
Dir ist aber schon klar, dass du Bytes prüfen musst, keine Char-Sequenzen? Geht das in Java mit Regex überhaupt?
-
Ich würde einen Webservice aufsetzen, der die ungültigen Zeichen aus einem on-demand generierten Excel-File liest. Das ist mehr enterprisy.
-
Ich bin auch der Meinung, dass eine Schleife übelster C-Style ist. Sowas braucht man in Zeiten von Klassen, Generics, usw nicht mehr. Da könnte man ja gleich if benutzen. Wo kämen wir denn da hin.
-
Bashar schrieb:
Ich würde einen Webservice aufsetzen, der die ungültigen Zeichen aus einem on-demand generierten Excel-File liest. Das ist mehr enterprisy.
Sehr gut