[LinuxFocus-icon]
LinuxFocus article number 279
http://linuxfocus.org

[Photo of the Authors]
par Katja and Guido Socher
<katja/at/linuxfocus.org guido/at/linuxfocus.org>

L´auteur:

Katja est l'éditrice Allemande de LinuxFocus. Elle aime Tux, le cinéma & la photo et la mer. Sa page personnelle se trouve ici.

Guido est un fan de Linux de longue date et il aime ce système pour les choix et la liberté qu'il offre. Il permet de sélectionner et de développer des solutions adaptées à vos besoins.



Traduit en Français par:
Georges Tarbouriech <gt/at/linuxfocus.org>

Lutter contre le "Spam"

[Illustration]

Résumé:

Le Spam dans le courrier !? Le Spam dans le courrier électronique augmente à une vitesse alarmante et devient un problème majeur pour presque tout le monde.
Dans cet article nous expliquerons comment réagir contre ce fléau.

_________________ _________________ _________________

 

Qu'est-ce que le "Spam" ?

Le Spam possède plusieurs noms. Certains le nomment UCE (Unsolicited commercial email - Courrier commercial non sollicité), d'autres l'appellent Courrier non désiré, mais dans tous les cas ces noms n'expliquent pas de quoi il s'agit vraiment. Si vous ne recevez pas (encore) de spam, consultez cette collection de spam (spam_samples.html). C'est une sélection aléatoire de messages reçus seulement en quelques jours. Lisez-les et vous comprendrez vite que ça n'a rien à voir avec le commerce ou les affaires. Ces "spammers" sont des criminels. Aucun "commercial" sérieux n'ennuierait ou n'offenserait des millions de personnes afin de trouver quelques "gogos" susceptibles d'acheter ses trucs.

C'est un classique malentendu de la part des personnes ayant peu utilisé Internet de croire que ce type d'annonce peut être comparé aux informations qu'ils reçoivent de temps en temps de leur supermarché. Les produits vendus par ce style de courrier sont souvent illégaux ou bien il ne s'agit même pas de produits. Ce sont des moyens destinés à vous soutirer de l'argent.  

Qu'est-ce que ça représente ?

Les "spammers" obtiennent vos adresses de courrier électronique à partir des pages web, des groupes de discussion ou des registres de domaines (si vous possédez votre propre domaine). Certains utilisent des robots pour extraire les adresses, les gravent su CD et les vendent à petit prix à d'autres "spammers". Si votre adresse figure en texte clair sur votre site, de tels programmes sont capables de l'extraire, et dans quelques temps vous aurez un gros problème que vous ne pourrez plus arrêter. Il s'amplifiera tous les jours !

En 1998 le pourcentage de spam envoyé à LinuxFocus représentait moins de 10%. En Novembre 2002, voilà à quoi ressemblent les statistiques :

Notre serveur reçoit environ 4075 messages par semaine. 3273 sont du "spam" !
=> 80% de tout le courrier est du Spam.

C'est-à-dire que 80% de la capacité du serveur de courrier et 80% de la bande passante sont utilisés pour quelque chose que personne ne veut.

Parmi ces 3273 messages non désirés, environ 40% viennent d'Amérique (essentiellement Canada, Etats-Unis, Mexique) et environ 30% viennent d'Asie (essentiellement Corée, Chine, Taiwan).  

Que faire contre le Spam ?

Si vous regardez les "échantillons" vous remarquerez que la plupart offrent la possibilité de se désinscrire de la liste. Ne le faites pas ! Vous avez affaire à des criminels. Aucun des "spammers" ne recevra quoi que ce soit si tant est qu'il maintienne une véritable liste de désinscription. Pourquoi alors continuer à proposer cette possibilité ? La réponse est simple. L'impression sur le lecteur est bien meilleure et c'est de plus un excellent outil statistique. Les "spammers" peuvent ainsi vérifier immédiatement que le courrier a bien été reçu. En d'autres termes vous accusez réception du courrier !

L'idée de liste de désinscription pose également un simple problème technique. LinuxFocus n'est pas un très gros site, mais il nous faudrait une personne à plein temps pour désinscrire 3273 messages non désirés par semaine et ce en désinscrivant un courrier par minute. Chaque "spammer" utilise une méthode différente et ce serait un travail stupide et stérile. Les listes de désinscription sont une absurdité et ne servent qu'aux "spammers".

La seule chose à faire consiste à effacer ces messages.

 

Logiciels pour contrôler le spam

Il existe plusieurs moyens de filtrer ce type de courrier et c'est une très bonne chose puisqu'il devient plus difficile pour les "spammers" de les contourner. C'est malgré tout une course à l'armement. Les outils de filtrage deviennent de plus en plus sophistiqués mais les "spammers" améliorent aussi leurs méthodes.

Il existe deux types de filtres :
  1. Les moyens de contrôle disponibles dans le MTA (Message Transfer Agent=Serveur de courrier). Ils permettent habituellement de rejeter le courrier. C'est-à-dire que vous ne le stockez même pas. Vous renvoyez un code d'erreur dès que vous identifiez le courrier comme étant du "spam" pendant la réception. Les outils classiques de ce type sont des listes de blocage basées sur les IP et des vérificateurs d'en-têtes de messages.

  2. Le filtrage après réception. Dans ce cas le courrier est effectivement distribué mais il est filtré a posteriori.
Nous allons maintenant étudier les différentes possibilités ainsi que leurs avantages et inconvénients. La meilleure solution pour se débarrasser du spam consiste à utiliser différents outils.  

Rejeter le courrier directement depuis le MTA

Si vous rejetez le courrier depuis le serveur pendant la réception, le "spammer" peut recevoir un code d'erreur lui indiquant que l'adresse ne fonctionne pas. S'il fait partie de la catégorie des "graveurs de CD", il est possible qu'il retire l'adresse. Cette méthode permet aussi d'économiser de la bande passante puisque vous ne recevez pas le message complet. Vous pouvez envoyer le code d'erreur dès que vous avez identifié qu'il s'agit de spam.

Pour ce faire, il vous faut un bon MTA le plus souple possible. Malheureusement les deux serveurs les plus répandus, Sendmail et celui de Bill Gates, ne sont pas du tout adaptés à cette tâche. Il existe deux autres très bonnes solutions : Postfix et Exim. Si vous ne pouvez pas changer de serveur vous pouvez ajouter un proxy smtp en amont du serveur (smtp = Simple Mail Transfer Protocol, le protocole de courrier d'Internet).

Nous allons maintenant présenter quelques techniques courantes de filtrage ainsi que leur fonctionnement. Bien sûr, il ne s'agira pas de décrire exactement la configuration de chaque MTA. L'article serait trop long. A la place, je propose de lire la documentation du MTA que vous utilisez. Postfix et Exim sont très bien documentés. Certains MTA possèdent encore plus d'options mais celles qui précèdent sont habituellement disponibles dans tout bon logiciel serveur de courrier. L'avantage de ces vérifications vient de ce qu'elles ne sont pas consommatrices de ressources. Le fait d'appliquer ces contrôles ne vous obligera pas à investir dans du nouveau matériel pour votre serveur de courrier.  

Filtrage du courrier déjà reçu

Les techniques suivantes sont généralement appliquées à l'ensemble du courrier et le serveur expéditeur ne remarquera même pas que les messages n'ont pas été distribués. Cela signifie aussi qu'un expéditeur légitime ne recevra aucun message de non réception. Le message disparaît tout simplement.
Cela dit, je dois préciser que ce qui précède est incorrect dans la mesure où tout dépend des possibilités de filtrage du serveur de courrier. Exim, par exemple, est très souple et permet d'écrire des filtres personnalisés.

De nombreuses autres solutions existent pour combattre le spam. Je pense que celles qui précèdent couvrent l'essentiel.

La meilleure solution consiste à contrôler dans le MTA dans un premier temps et à se débarrasser du spam restant dans un deuxième temps à l'aide d'un filtrage a posteriori.  

Courrier HTML

Une forme particulièrement dangereuse de spam est celle du courrier au format HTML.

La plupart des "spammers" proposent la "possibilité de désinscription" afin de voir combien de messages aboutissent. Le courrier au format HTML offre un bien meilleur moyen de contrôle : les images. Vous pouvez comparer ce système à celui des compteurs de visites trouvés sur certaines pages web. Le "spammer" peut connaître exactement le nombre de messages lus et à quel moment ils l'ont été. Si vous étudiez attentivement le spam, vous découvrirez que dans certains cas l'URL des images incluses contient un numéro séquentiel : le "spammer" peut savoir qui lit le courrier et quand. Une incroyable faille de sécurité.

Les programmes modernes de lecture de courrier n'afficheront pas les images téléchargées à partir d'une URL. Toutefois, il n'existe pas franchement de lecteur de courrier HTML moderne et sûr. Kmail et la toute dernière version de Mozilla mail proposent de désactiver les images provenant d'une source externe. La plupart des autres programmes fourniront d'excellentes statistiques au "spammer".

La solution ? N'utilisez pas de programmes aptes à lire le courrier HTML ou bien téléchargez votre courrier et déconnectez-vous avant de lire vos messages.  

D'où vient le spam ?

Ne faites jamais confiance à l'adresse de l'expéditeur se trouvant dans le champ "From" du courrier non désiré ! Il s'agit soit d'utilisateurs fantômes ou de victimes innocentes. Il est très rare que ce soit la véritable adresse du "spammer". Si vous voulez savoir d'où vient le courrier vous devez lire l'en-tête complet :
...

Received: from msn.com (dsl-200-67-219-28.prodigy.net.mx [200.67.219.28])
        by mailserver.of.your.isp (8.12.1) with SMTP id gB2BYuYs006793;
        Mon, 2 Dec 2002 12:35:06 +0100 (MET)
Received: from unknown (HELO rly-xl05.dohuya.com) (120.210.149.87)
        by symail.kustanai.co.kr with QMQP; Mon, 02 Dec 2002 04:34:43
Ici, un hôte inconnu dont l'adresse IP est 120.210.149.87 prétendant être rly-xl05.dohuya.com envoie un courrier à symail.kustanai.co.kr. symail.kustanai.co.kr prend le relais et envoie le message à son destinataire.
Le "spammer" se cache quelque part derrière 120.210.149.87 qui est probablement l'adresse IP dynamique d'une connexion par modem.

En d'autres termes, la police pourrait trouver cette personne en se rendant chez le propriétaire de kustanai.co.kr et en réclamant les logs du serveur et une liste des communications de la compagnie téléphonique locale. Vous avez donc très peu de chances de trouver de qui il s'agit.

Il est également possible que la première partie de l'adresse soit truquée et que le "spammer" se trouve réellement derrière dsl-200-67-219-28.prodigy.net.mx. C'est parfaitement envisageable puisqu'il n'y a aucune raison pour laquelle symail.kustanai.co.kr devrait envoyer le courrier à msn.com par la connexion par modem dsl (dsl-200-67-219-28.prodigy.net.mx). Le serveur.de.votre.fai (nom symbolique) est le serveur de votre prestataire et seule la partie de la ligne "Received:" est fiable.

Il est possible de trouver le "spammer" mais il vous faut l'aide des services secrets et de la police pour aller chez prodigy.net.mx.  

Conclusion

Si le spam continue à se développer à ce rythme, Internet transportera bientôt plus de spam que de véritable courrier électronique. Le spam circule aux frais du destinataire. De plus en plus de bande passante est nécessaire et souvent les systèmes de courrier doivent être améliorés pour pouvoir gérer le spam.
Les lois de la plupart des pays ne font pas grand chose pour protéger les gens contre ces criminels. En fait, certains pays ont des lois qui servent à pénaliser les honnêtes gens (Gestion des droits "numériques", etc) et à aider les criminels (par exemple à obtenir d'excellentes statistiques sur le spam).

Rejoignez la "Coalition Against UCE" ! (Coalition contre le courrier commercial non désiré).
euro.cauce
http://www.euro.cauce.org/en/
cauce
http://www.cauce.org/


Les Fournisseurs d'Accès à Internet devraient contrôler leurs systèmes de courrier. Aucun accès non authentifié aux serveurs de courrier ne devrait être accordé et la quantité de message qu'un utilisateur peut envoyer par minute devrait être limitée.  

Références



Site Web maintenu par l´équipe d´édition LinuxFocus
© Katja and Guido Socher
"some rights reserved" see linuxfocus.org/license/
http://www.LinuxFocus.org
Translation information:
en --> -- : Katja and Guido Socher <katja/at/linuxfocus.org guido/at/linuxfocus.org>
en --> fr: Georges Tarbouriech <gt/at/linuxfocus.org>

2005-01-14, generated by lfparser_pdf version 2.51