Normalisierung und Einschränken von Wertebereichen

*Rewind*

Hallo,

ich habe folgendes mathematisches Problem: ich habe unterschiedliche Wertebereiche auf einen von 0 bis 1 mit Quantilen Q1 und Q99 normalisiert. Das Problem ist aber, dass ich für die 2% der Objekte Werte < 0 und > 1 habe, und das will ich vermeiden, denn ich normalisiere mehrere Datensätze, um sie vergleichbar zu machen, aber die über den Wertebereich [0;1] hinausgehenden Werte variieren extrem. Ich kann sie nicht rausschmeißen und ich kann keine if-Abfragen machen. Kann man die einfache Formel der Normalisierung (x - Q1)/(Q99-Q1) so ergänzen, dass die Werte von diesen 2%-Objekten automatisch auf 0 bzw. 1 gesetzt werden?

Danke und Grüße,
Rew.

krümelkacker

max( 0.0, min( (x-Q1)/(Q99-Q1), 1.0 ) )