23/08/2004 @ 22:41:01: Spam - Un algorithme de séquencage ADN utilisé contre le SPAM!
C'était déjà pas facile de prononcer le noms des différentes techniques de filtrage de spam (bayesian), en voici une nouvelle encore plus difficile! Chung-kwei!
Cet algorithme a été développé pour retrouver des morceaux d'ADN qui se répète afin d'en déterminer l'importance. En effet, une séquence qui se répète est apparemment souvent une séquence importante... Jusque la, rien de comparable au spam, sauf qu'ici les ingéneurs d'IBM ont décidé de remplacer les séquences ADN par des séquences de mots.
L'algorithme serait en mesure de retrouver jusqu'à 97% de spams, jusqu'à ce que les spammeurs évoluent il faut supposer, mais l'algorithme aura ses chances dans SpamGuru, un produit IBM et peut être même dans SpamAssassin!
Avec un peu de chance et un peu d'effet darwin, on aura plus de spams d'ici à quelques générations, non?
Euh, à la limite, pour les spams nigérians, je veux bien car ils sont souvent verbeux, mais pour les autres qui comptent généralement moins de 50 mots, ca va faire court pour trouver une séquence qui se répète...
"enlarge your penis" ça suffit pas?
viagra roulaize?
vidocin online?
petite bite?
enlarge your penis?
ca c'est pas de la détection au sein d'un même message, c'est de la détection de mots type bayesian avec un pourcentage de chance de les retrouver dans un spam
Popular soft for very low price