Wie funktionieren Spam-Filter



  • Warum landen E-Mails von Facebook, Linkedin usw. nicht im Spam? Die verschicken doch sicher millionen Mails täglich 😕



  • Warum sollten sie ?
    Schau mal nach wie Spamfilter funktionieren, als Spam wird die Mails ja nicht (nur) nach Menge der versendeten Mails eingestuft.
    Es gibt viele Arten Spam zu erkennen:

    • Die Einfachste wäre ein Textfilter, einfach eine Plaintextsuche nach Wörtern wie sie in Spammails häufig vorkommen, z.B. "kaufen" "dringend" etc., oder nach HTML-Tags die die Schriftgröße anpassen. Das kann auch sehr kompliziert werden, so dass auch Rechtschreibfehler, Leetspeek, und Sonderzeichen die wie die normalen ASCII-Zeichen aussehen erkannt werden.
      Oder zusätzlich auch eine Suche nach dubiosen Attachments, Links, Bildern, etc.
      Da seriöse Mails solche Tricks kaum nötig haben, sollten sie da auch nicht durchfallen, oder zumindest weniger häufig.
    • Das Nächste wäre eine Analyse des Headers, um eventuell gefakte Header die die Nachricht seriös scheinen lassen zu enttarnen.
      Seriöse Portale brauchen sich nicht zu verstellen, ergo: kein Problem
    • Back-/Whitelists, Reputation.
      Sollte eigentlich selbsterklärend sein, Listen die bekannte Spammer enthalten um diese einfach zu erkennen. Als Gegenstück eventuell noch Listen von vertrauenswürdigen Absendern. Eventuell kann man diese Kategorisierung auch automatisch machen, wenn ein Absender von vielen als Spam gemeldet wird, dann wird er auf die Blacklist gesetzt. Wenn eine Adresse allerdings oft als "Kein Spam" gemeldet wird, dann nimmt man sie von der Blacklist runter, sodass der Spamfilter sie in Zukunft durchlässt.

    Auch wenn die genaue Funktionsweise oft geheim gehalten wird da die Spammer den Filter ja ganz einfach austricksen könnten, sollte das doch reichen um zu verstehen wie Filter arbeiten. Und zu verstehen warum sie meistens nur Spam und nicht legitime Mails filtert. 😉



  • Also ich hab vor kurzem von Firmen ein Angebot eingeholt. Die Mail war normal, ohne Anhang. Hab sie an die erste Firma geschickt und ca. 7-15 im BCC. Dann kam ein Angebut und im Betreff stand: "[Spam] ..." 😞

    Ist es besser die einzeln zu verschicken 😕



  • kleinr schrieb:

    Ist es besser die einzeln zu verschicken 😕

    Nein, das macht keinen Unterschied. Vielleicht war deren Spamfilter auch nur überempfindlich oder du hast von einem zwielichtigen Mailserver aus verschickt oder das Setup des Mailservers ist einfach nicht besonders gut oder du hast zufällig ein paar böse Worte erwähnt oder…

    Bei Spamfiltern kommen häufig auch simple Machine Learning-Komponenten zum Einsatz, zB. sowas:

    http://en.wikipedia.org/wiki/Bayesian_spam_filtering
    http://www.paulgraham.com/spam.html



  • kleinr schrieb:

    Also ich hab vor kurzem von Firmen ein Angebot eingeholt. Die Mail war normal, ohne Anhang. Hab sie an die erste Firma geschickt und ca. 7-15 im BCC. Dann kam ein Angebut und im Betreff stand: "[Spam] ..." 😞

    Ist es besser die einzeln zu verschicken 😕

    Manche Filter markieren Emails, bei denen das Empfänger-Konto weder bei To:, noch bei CC: steht als Spam.

    Außerdem ist BCC: meistens unhöflich.



  • oenone schrieb:

    Außerdem ist BCC: meistens unhöflich.

    Zukünftig schick ich dir dann natürlich alles To:...

    Ich bin ja meist lernfähig 😉


Anmelden zum Antworten