Stoppt die Vorratsdatenspeicherung! Jetzt klicken &handeln! Willst du auch an der Aktion teilnehmen? Hier findest du alle relevanten Infos und Materialien:

Archive for the 'E-Mail' Category

Text::AI::CRM114

I released my first CPAN module.

I finally played with libcrm114, a C library that implements several text classification algorithms. It is a potential replacement for the mailreaver.crm tool, which is the basis for my SpamAssassin plugin. Read the rest of this entry »

my mailserver grows up

Yay, I received my 200th spam mail after I set up my own mailserver in January. – Now my SpamAssassin can use its Bayes classifier.  %-)

Procrastination @ work

erfassen wir doch mal die SpamAssassin-Scores…
Read the rest of this entry »

Mailing List Statistics

Recently a friend showed me the tool MailListStat to generate mailing list statistics and I thought it would be much easier to implement this in Perl or Python instead of C.
So I tried and the result is Py-MailListStat 1.0 (I am not very creative with names). Maybe someone finds it useful…

HELO-Check, die zweite

Weil ich letztens auf HELO-Checks angesprochen wurde habe ich mir nochmal angesehen was ich damit so alles filtere. Im Dezember 2007 hatte ich schonmal eine Stichprobe beschrieben und versuche nun möglichst gleich auszuwerten.

Read the rest of this entry »

Spam-Pause

Am Wochenende blieb einfach der Spam weg. Ich fürchtete schon Fehler im DNS oder Paketfilter… aber der RackBlogger und Heise beobachteten das gleiche Phänomen und heute hat sich alles wieder normalisiert:

mailgraph und rejects

Ich hab mal wieder an meinem mailgraph gedreht weil seit ca. einem Jahr die Zahl der Rejects um ein vielfaches größer ist als die Zahl der angenommenen Mails.

Read the rest of this entry »

Scripte

Eigentlich veröffentliche ich ungern Skripte. Das hat mehrere Gründe: zunächst sind die meisten sehr simpel und alle die sich auskennen sollte sie schnell selbst schreiben können (und wer sich nicht auskennt sowieso erstmal die Doku lesen); verbunden damit ist die Versuchung ein Skript als black box auszuführen, ohne wenigstens einmal reinzuschauen. Bei Admin-Funktionen kann dann schon ein kleiner Fehler oder ein unterschiedlicher Pfad sehr gefährlich sein. Zuguterletzt sehen meine Skripte auch nie so professionell aus wie dieses example of script development :-)

Aber vielleicht kann ja doch jemand etwas hiermit anfangen, dem Skript mit dem ich meine Spamfilter trainiere.

Annahme ist, dass Spam- und Ham-Mails in zwei Ordnern gesammelt werden (bei mir sind das Cyrus-IMAP-Ordner) und dass CRM1114 mit reaver_cache benutzt wird. Für jede Mail in den Ordnern wird die CacheID gesucht und nachgesehen ob SpamAssassins Bayes-Filter bzw. CRM114 die Mail richtig klassifiziert haben. Alle nicht korrekt erkannten Mails werden schließlich gelernt.

Vorteil gegenüber normalem mailtrainer.crm und sa-learn ist die Benutzung des CRM114-Caches für SpamAssassin und die Optimierung auf nicht erkannte Mails.