Qu'est-ce que le spam et comment lutter contre les spammeurs sur Internet. Présentation du système anti-spam Kaspersky Anti-Spam Quelles méthodes anti-spam existent

Chers amis et utilisateurs de notre site, je suis de nouveau avec vous, SpaceWolf, et aujourd'hui nous parlerons du problème urgent du « SPAM ». La solution à ce problème vous permettra de vous débarrasser spam sur le formulaire retour , commentaires indésirables ou spam pour les commandes dans la boutique en ligne.

Je voudrais immédiatement noter les avantages et les inconvénients de cette méthode :

  1. Fonctionne bien contre les robots.
  2. Installation rapide dans le formulaire d'envoi de message
  3. Code minimum (3 lignes)
  4. Ne nécessite pas de connaissances particulières, hormis l'emplacement des fichiers principaux.
  5. Les utilisateurs qui ne disposent pas de Java ne pourront pas passer la vérification et donc envoyer un message.

En gros, tout. Commençons l'installation :

1) Ajoutez un champ masqué supplémentaire à votre formulaire (il s'agit d'un formulaire de commentaires, d'un formulaire de commentaires, d'un formulaire de commande de produits) avec le nom nom = "vérifier" signification valeur = "" laissez-le vide. Exemple:

2) Sous le même formulaire mais uniquement dans le bouton (« envoyer », « écrire », « Laisser un avis » ou peu importe comment vous l'appelez), ajoutez le code suivant :

If ($_POST["check"] != "stopSpam") exit("Spam détecté");

Protection anti-spam : comment ça marche

Le principe est aussi simple que le code lui-même. Il est conçu pour garantir que les robots spammeurs ne sachent pas comment exécuter des programmes sur Javascript. À l'époque où utilisateur régulier cliquera sur le bouton « commander » dans notre champ caché, le mot « stopSpam » sera renseigné, et dans le cas d'un robot, ce champ restera vide. Laissez-moi vous expliquer à ce stade pourquoi il restera vide ? Le robot remplit tous les champs sauf notre champ d'identification caché identifiant = "vérifier" et variable "vérifier" restera vide, le mail ne sera donc pas envoyé. Et lorsque l'utilisateur clique sur le bouton, notre Javascript, que nous avons ajouté au bouton.

Je vous conseille d'utiliser cette méthode en conjonction avec le captcha, l'effet sera meilleur.

Eh bien voilà tout. Si l’article vous a aidé, écrivez des commentaires, republiez et n’oubliez pas de dire « Merci » dans les commentaires.

Si quelqu'un a d'autres problèmes ou questions, laissez-les dans les commentaires, nous serons heureux de trouver une solution ensemble. Nous attendons vos messages !

Il s'agit d'un nouveau produit de Kaspersky Lab conçu pour une protection complète de votre ordinateur personnel. Ce programme offre une protection fiable et simultanée contre les virus, les pirates et le spam. Module Kaspersky Anti-Spam est l’un des éléments de ce système de protection informatique domestique. Tout d'abord, il convient de noter que Kaspersky Anti-Spam n'est pas un produit indépendant et ne fonctionne pas séparément de Kaspersky Personal Security Suite. Dans une certaine mesure, cela peut être qualifié d'inconvénient, puisque les utilisateurs ne peuvent pas utiliser Kaspersky Anti-Spam séparément, mais une protection complète présente également des avantages incontestables.

Protection antivirus et pare-feu ont été examinés plus d'une fois sur les pages de notre publication. Par conséquent, dans cet article, nous examinerons exclusivement le fonctionnement du module antispam.

La base de Kaspersky Anti-Spam est la technologie intelligente SpamTest, qui fournit : une comparaison floue (c'est-à-dire déclenchée même en cas de correspondance incomplète) de la lettre vérifiée avec des échantillons - les lettres précédemment identifiées comme spam ; identification des phrases caractéristiques du spam dans le texte de la lettre ; détection des images précédemment utilisées dans les courriers indésirables. En plus des critères répertoriés ci-dessus, des paramètres formels sont également utilisés pour identifier le spam, notamment :

  • des listes « noire » et « blanche » que l'utilisateur peut maintenir ;
  • diverses fonctionnalités d'en-tête message électronique, caractéristiques du spam, - par exemple, des signes de falsification de l'adresse de l'expéditeur ;
  • techniques utilisées par les spammeurs pour tromper les filtres de messagerie : séquences aléatoires, remplacement et doublement de lettres, texte blanc sur blanc, etc. ;
  • vérifier non seulement le texte de la lettre elle-même, mais également les fichiers joints en texte brut, HTML, MS Word, RTF et autres formats.

Installation du module antispam

Le module est installé lors de l'installation de Kaspersky Personal Security Suite. Lors du choix des options d'installation, un utilisateur qui utilise des clients de messagerie autres que les programmes de messagerie Microsoft ne peut pas installer le module pour Microsoft Outlook.

Il convient de noter que Kaspersky Anti-Spam analyse toute correspondance reçue via le protocole de messagerie SMTP. Grâce à cela, il peut filtrer le spam dans n'importe quel programme de messagerie, mais nous en parlerons ci-dessous.

Intégration dans Microsoft Outlook Express

Le programme n'a pas sa propre interface en tant que telle. Chez Microsoft Outlook Express Le module Kaspersky Anti-Spam est intégré sous forme de menu et de panneau supplémentaire.

On peut noter quelques inconvénients lors de l'utilisation de ce panneau, même si cela n'a rien à voir avec le module antispam lui-même. En raison des principes de fonctionnement du mécanisme Programmes Microsoft Le panneau Outlook Express Kaspersky Anti-Spam ne peut pas être ancré dans un endroit pratique pour l'utilisateur. Chaque fois que vous démarrez le programme, le panneau apparaîtra en troisième position. Vous devrez constamment le déplacer vers un endroit pratique ou accepter cet état de fait.

Fonctionnement du programme

Lors de la réception du courrier, Kaspersky Anti-Spam analyse la correspondance entrante. Si du spam est détecté, la lettre est marquée d'une étiquette spéciale [!! SPAM] dans le champ Objet et placé dans le dossier Éléments supprimés. Les messages identifiés comme non spam ne sont marqués de rien et sont traités par le programme de messagerie conformément aux règles établies. Si le programme n'est pas sûr que la lettre soit du spam, alors le [?? Spam probable] et la lettre est placée dans la boîte de réception pour que l'utilisateur puisse prendre une décision finale. De plus, le programme utilise deux autres types d'étiquettes : - pour les lettres au contenu obscène et - pour les lettres générées automatiquement, par exemple les lettres provenant de robots de messagerie.

Grâce à ces étiquettes, vous pouvez organiser le travail de Kaspersky Anti-Spam avec n'importe quel autre programme de messagerie. Il suffit de créer des règles dans votre client de messagerie pour trier les emails selon ces balises. Dans Microsoft Outlook lui-même, ces dossiers sont créés en un seul clic sur un bouton dans la fenêtre des paramètres du module antispam.

Programme de formation

Le programme peut être formé de deux manières : en classant les messages reçus par l'utilisateur comme spam - et non spam, et en téléchargeant des mises à jour depuis le serveur du Laboratoire. La première méthode vous permet de former le programme sous courrier personnel utilisateur, la seconde consiste à répondre rapidement aux événements de spam massifs sur Internet.

Lorsque vous le lancez pour la première fois, Kaspersky Anti-Spam extraira toutes les adresses du carnet d'adresses de Microsoft Outlook pour les placer dans la « Liste d'amis ». Toutes les lettres de ces destinataires seront perçues par le module antispam comme n'étant pas du spam et seront transmises sans contrôle. Par la suite, l'utilisateur peut modifier cette liste en y ajoutant ou en supprimant des destinataires. En plus de la « Liste d'amis », il existe également une « Liste d'ennemis ». Toute correspondance reçue de destinataires figurant sur la liste d'ennemis sera clairement classée comme spam.

L'ajout de destinataires à vos listes d'amis ou d'ennemis se fait simplement en cliquant sur un bouton spécial du panneau Kaspersky Anti-Spam. Des formations y sont également dispensées. Si vous manquez un spam, il vous suffit de cliquer sur le bouton « Ceci est un spam ». Une fenêtre apparaîtra dans laquelle l'utilisateur devra indiquer au programme quoi faire avec ce message.

La commande « Envoyer comme exemple de spam » génère une lettre à Kaspersky Lab avec un message sur le spam pour une formation ultérieure. Cette commande peut être ignorée. Vous pouvez négliger d'ajouter l'auteur aux ennemis, mais vous devez absolument ajouter la lettre aux échantillons de spam. C'est ainsi que le programme est formé pour la correspondance personnelle.

Kaspersky Anti-Spam ne s'intégrant pas à d'autres clients de messagerie, sa formation à ces programmes n'est possible que grâce aux mises à jour reçues du serveur du Laboratoire. Malheureusement, cette option de formation ne permet pas de former le programme aux spécificités du courrier personnel.

Paramètres

Dans les paramètres du programme, vous pouvez : spécifier l'emplacement des bases de données du module, si l'utilisateur souhaite qu'elles soient stockées dans un emplacement non standard ; désactiver ou activer le filtrage ; définir les paramètres de mise à jour et afficher les statistiques.

Le module Kaspersky Anti-Spam offre une protection assez complète du courrier des utilisateurs contre le spam. Comme tout autre programme, il nécessite une formation. Et pendant que cet apprentissage se produit, les e-mails corrects peuvent être reconnus à tort comme du spam et vice versa. Un inconvénient relatif est que le module ne permet pas de supprimer sur le serveur les messages qui constituent du spam évident. L'utilisateur doit quand même consacrer son trafic à ces lettres inutiles. D’un autre côté, avec cette approche du filtrage anti-spam, aucun message précieux ne sera perdu. À tous autres égards, Kaspersky Anti-Spam mérite la plus grande attention, notamment compte tenu de l'intégration du module avec d'autres programmes qui assurent la sécurité de l'ordinateur de l'utilisateur.

Les spams modernes sont distribués en centaines de milliers d’exemplaires en quelques dizaines de minutes seulement. Plus souvent le spam arrive via les ordinateurs des utilisateurs infectés par des logiciels malveillants - des réseaux zombies. Que peut-on contrer à cet assaut ? Industrie moderne La sécurité informatique offre de nombreuses solutions et les anti-spammeurs disposent de diverses technologies dans leur arsenal. Cependant, aucune technologie existante ne constitue une « solution miracle » contre le spam. Il n’existe tout simplement pas de solution universelle. La plupart des produits modernes utilisent plusieurs technologies, sinon l'efficacité du produit ne sera pas élevée.

Les technologies les plus connues et les plus courantes sont répertoriées ci-dessous.

Listes noires

Ce sont également des DNSBL (DNS-based Blackhole Lists). Il s’agit de l’une des technologies antispam les plus anciennes. Bloquez le courrier provenant des serveurs IP répertoriés dans la liste.

  • Avantages: La liste noire bloque à 100 % le courrier provenant d'une source suspecte.
  • Inconvénients : Ils donnent haut niveau Il s’agit de faux positifs et doit donc être utilisé avec prudence.

Contrôle des foules (DCC, Razor, Pyzor)

La technologie consiste à identifier en masse dans le flux de courrier des messages absolument identiques ou légèrement différents. Pour construire un analyseur « de masse » fonctionnel, d'énormes flux de courrier sont nécessaires, cette technologie est donc proposée par les grands fabricants qui disposent de volumes importants de courrier qu'ils peuvent analyser.

  • Avantages: Si la technologie fonctionnait, elle était alors assurée de détecter un envoi massif.
  • Inconvénients : Premièrement, un « gros » mailing peut ne pas être du spam, mais un courrier tout à fait légitime (par exemple, Ozon.ru, Subscribe.ru envoient des milliers de messages presque identiques, mais ce n'est pas du spam). Deuxièmement, les spammeurs savent comment « percer » cette protection grâce à des technologies intelligentes. Ils utilisent des logiciels qui génèrent divers contenus – textes, graphiques, etc. - dans chaque courrier indésirable. En conséquence, le contrôle des foules ne fonctionne pas.

Vérification des en-têtes de messages Internet

Les spammeurs écrivent programmes spéciaux pour générer des messages de spam et les distribuer instantanément. Dans le même temps, ils commettent des erreurs dans la conception des en-têtes ; de ce fait, le spam ne répond pas toujours aux exigences de la norme de messagerie RFC, qui décrit le format des en-têtes. Ces erreurs peuvent être utilisées pour identifier un message de spam.

  • Avantages: Le processus de reconnaissance et de filtrage du spam est transparent, réglementé par des normes et assez fiable.
  • Inconvénients : Les spammeurs apprennent rapidement et les erreurs d’en-tête de spam sont de moins en moins nombreuses. L’utilisation de cette technologie à elle seule ne vous permettra pas d’arrêter plus d’un tiers de tous les spams.

Filtrage du contenu

C'est également l'une des technologies anciennes et éprouvées. Le message de spam est vérifié pour détecter la présence de mots, de fragments de texte, d'images et d'autres éléments caractéristiques du spam. Le filtrage de contenu a commencé par l'analyse du sujet du message et des parties de celui-ci contenant du texte (texte brut, HTML), mais désormais les filtres anti-spam vérifient toutes les parties, y compris les pièces jointes graphiques.

À la suite de l’analyse, une signature textuelle peut être créée ou le « poids du spam » d’un message peut être calculé.

  • Avantages: Flexibilité, capacité à affiner rapidement. Les systèmes fonctionnant sur cette technologie s'adaptent facilement aux nouveaux types de spam et font rarement des erreurs en distinguant le spam du courrier normal.
  • Inconvénients : Des mises à jour sont généralement nécessaires. Les réglages des filtres sont effectués par des personnes spécialement formées, parfois par des laboratoires antispam entiers. Un tel support est coûteux, ce qui affecte le coût du filtre anti-spam. Les spammeurs inventent des astuces spéciales pour contourner cette technologie : ils introduisent du « bruit » aléatoire dans le spam, ce qui rend difficile la recherche des caractéristiques d'un message et leur évaluation. Par exemple, ils utilisent des symboles non littéraux dans les mots (voici à quoi peut ressembler par exemple le mot viagra en utilisant cette technique : vi_a_gra ou vi@gr@), génèrent des fonds de couleurs variables dans les images, etc.

Filtrage de contenu : Bayes

Les algorithmes statistiques bayésiens sont également conçus pour l’analyse de contenu. Les filtres bayésiens ne nécessitent pas de réglage constant. Tout ce dont ils ont besoin, c'est d'une formation préalable. Ensuite, le filtre est ajusté aux sujets de courrier électronique typiques de cet utilisateur particulier. Ainsi, si un utilisateur travaille dans le système éducatif et dispense une formation, les messages personnels sur ce sujet ne seront pas reconnus comme spam. Pour ceux qui n'ont pas besoin d'offres pour assister à une formation, le filtre statistique classera ces messages comme spam.

  • Avantages: Personnalisation.
  • Inconvénients : Fonctionne mieux sur le flux de courrier individuel. Installer Bayes sur un serveur d'entreprise avec une messagerie hétérogène est une tâche difficile et ingrate. L'essentiel est que le résultat final sera bien pire que pour des boîtes individuelles. Si l’utilisateur est paresseux et n’entraîne pas le filtre, la technologie ne sera pas efficace. Les spammeurs s’efforcent spécifiquement de contourner les filtres bayésiens, et ils y parviennent.

Liste grise

Refus temporaire de recevoir un message. Le refus est accompagné d'un code d'erreur compris par tous les systèmes de messagerie. Après un certain temps, ils renvoient le message. Et les programmes qui envoient du spam ne renvoient pas la lettre dans ce cas.

  • Avantages: Oui, c'est aussi une solution.
  • Inconvénients : Retard dans la livraison du courrier. Pour de nombreux utilisateurs, cette solution est inacceptable.

Introduction au problème

Nous savons tous ce qu'est le spam, soit parce que nous en avons rencontré, soit parce que nous en avons entendu parler. Nous savons tous comment les spammeurs collectent les adresses e-mail. Ce n’est également un secret pour personne que le spam ne peut pas être complètement vaincu. Le problème est de savoir comment protéger au maximum les utilisateurs qui laissent leurs coordonnées sur votre site Web avec un minimum d'effort.

Méthodes de protection précédemment testées

La plus grande menace boîtes aux lettres représentent des programmes qui téléchargent des sites Web et prennent des adresses postales à partir du texte des pages. Soit ils téléchargent uniquement votre site, soit ils se promènent comme moteurs de recherche, sur tout le réseau. Si votre site est petit, la protection de remplacement automatique de texte suivante est tout à fait suffisante :

]+href=)([""]?)mailto:(+)()@".
"()(+.(2,4))2([ >])~i", "1"mailto : [email protégé]"
onMouseover="this.href="mai" + "lto:3" + "4" + "%40" + "5" + "6";"7", $text); ?>

Malheureusement, cela ne fonctionnera pas si vous avez un grand site. Disons spectateur.ru, dont l'auteur a été l'un des premiers à utiliser cette méthode. Si j'étais un spammeur, j'irais dans les paramètres personnels, cocherais la case « ne pas montrer les oreilles », 1000 avis sur la page et attraperais les cookies avec Proxomitron. Ensuite, à l'aide d'un rocker ou d'un script PHP, je téléchargeais des pages avec des commentaires (en remplaçant les cookies par des paramètres) et en utilisant expression régulière J'ai récupéré les adresses. J'obtiendrais une petite base pour les mailings publicitaires.

Il existait quelques autres méthodes de protection dans lesquelles le lien mailto: était automatiquement remplacé par un autre, mais l'effet restait le même : lorsque vous cliquiez dessus, le client système créait une lettre à l'adresse souhaitée. Ni l’un ni l’autre n’ont résisté aux critiques.

Rencontrez les hérissons

Evidemment, il est difficile de proposer une autre méthode de protection que celle déjà testée : prévoir un formulaire sur le site pour envoyer un message. Commençons par le concevoir. Les avantages de cette méthode sont évidents : personne ne pourra obtenir les adresses de sa base de données spam à partir de votre site Web. Il ne sera pas possible d'envoyer des messages en masquant votre adresse, comme le font les spammeurs : le serveur Web enregistrera son adresse IP. Les listes de serveurs proxy anonymes publics sont régulièrement mises à jour et il est facile d'en bloquer l'accès.

Expéditeur du formulaire

Commençons par ceci, car c'est la partie la plus difficile.

Lors de l'installation d'un expéditeur de formulaire sur un site, il est important de le protéger des attaques de hooligans, qui ne peuvent être aussi simples que le spam. Nous devrons donc faire de gros efforts dans ce sens.

Tout d’abord, protégeons-nous des doubles clics stupides et de l’envoi de nombreuses requêtes identiques. L'idée est la suivante : le message ne sera pas envoyé si l'utilisateur n'a pas préalablement ouvert la page avec le formulaire, et en ouvrant la page avec le formulaire, le message ne peut être envoyé qu'une seule fois. Cela peut être fait à l'aide de sessions intégrées à PHP. Lors de l'ouverture d'une page avec un formulaire, nous lancerons une session dans laquelle nous enregistrerons une variable, disons $flag. Nous afficherons l'ID de session comme élément caché à la toute fin du formulaire. L'utilisateur saisit un message et soumet le formulaire. Dès réception du formulaire, le script démarre une session et vérifie la présence et la valeur de la variable $flag. Si la variable n'existe pas, alors il s'agit d'un clic répété, la lettre n'est pas envoyée et un message d'erreur s'affiche. Si la variable existe et que les données du formulaire nous conviennent (les champs obligatoires sont remplis), le script envoie une lettre et supprime la session.

Deuxièmement, protégeons-nous des hooligans intelligents en enregistrant des journaux de messages. Si l'utilisateur soumet un formulaire correctement rempli, le script examinera les journaux et vérifiera ce qu'il contient. Oui, ça devrait être interdit

* envoyer des messages à la même adresse plus souvent qu'une certaine période
* envoyer le même texte à différentes adresses
* et utilisez simplement l'expéditeur du formulaire trop souvent - disons, pas plus de 10 messages par jour et par utilisateur

Nous affichons l'ID de session à la toute fin du formulaire, de sorte que le pirate informatique doive télécharger l'intégralité du formulaire et l'analyser, ce qui est plus compliqué que le simple envoi de requêtes HTTP. Naturellement, l'expéditeur du formulaire émettra des messages concernant des erreurs de rédaction du message, l'obligation d'indiquer une adresse de retour, etc.

Le code de l’expéditeur du formulaire résultant s’est avéré trop volumineux pour être inclus dans le texte. Il a été archivé sur le site Internet. Il semble que le script fonctionne et envoie des messages.

Remplacer les adresses dans le texte

L'expéditeur du formulaire est maintenant prêt et vous devez remplacer tous les e-mails par des liens vers celui-ci. Bien entendu, vous ne devriez pas le faire manuellement. Pour ma part, j'ai écrit un script qui remplace automatiquement les adresses par des liens vers l'expéditeur du formulaire.

...Inconvénients : plus de temps pour ranger les liens (compensé par le répertoire des liens), l'utilisateur, lorsqu'il passe le curseur sur un lien, ne voit pas à quelle adresse il va se rendre. (Dmitry Smirnov, « Projet d’auteur idéal, hypertextualité »)

Tous les inconvénients mentionnés peuvent être facilement éliminés si vous utilisez un code similaire à celui que je vais maintenant décrire et montrer.

Il n'y a rien de compliqué ici ; s'il s'agit de liens, alors « plus de temps pour l'arrangement » n'est pas nécessaire. Sur mon site, j'utilise un script de moteur qui est appelé par toutes les pages, ce n'est donc pas un problème d'y ajouter du code ou de l'appeler à partir de celui-ci pour remplacer les adresses. Les adresses postales étaient et sont écrites directement dans le texte des pages, mais avant d'être affichées à l'utilisateur, elles sont remplacées par le texte requis. Compiler une base de données de liens ou d’adresses e-mail n’est pas un problème.

Alors, à quoi sert un remplaçant d'adresse ? Il recherche les liens « mailto : » dans le texte, en sélectionne les adresses, envoie une requête à la base de données pour compter (count(*)) combien d'adresses parmi celles de la page se trouvent dans un tableau spécial. S'il y a de nouvelles adresses sur la page, leur nombre sera supérieur au résultat de la requête. Dans ce cas, une requête est effectuée dans laquelle les valeurs d'adresse sont sélectionnées et celles déjà existantes dans le tableau sont exclues de la liste. La liste restante est envoyée à la table à l'aide d'une requête INSERT.

Quant aux adresses d'identification, à mon avis, il est préférable d'utiliser quelque chose qu'un visiteur du site n'a pas pu trouver. Pouvez-vous imaginer le lien /email.php?id=10 menant à l'expéditeur du formulaire ? Quelle tentation d’y mettre 11, 12, etc. et essayez de leur envoyer à tous un message. Par conséquent, j'ai décidé d'utiliser le hachage md5 des adresses comme identifiants. Il est peu probable que quiconque entreprenne de sélectionner le hachage. Dans le cas d'un répertoire de liens, vous pouvez vous débrouiller avec l'ID, mais vous devez ensuite sélectionner toutes les valeurs de la base de données, et remplacer les adresses par leurs hachages est beaucoup plus simple.

Une commande du formulaire est exécutée

]+href=)". "([""]?)mailto:(+@+". ".(2,4))2(.*?>)~ie", ""12"/email.php ?email=".urlencode(md5("3")). ""4"", $text); ?>

...qui remplace les adresses par leurs hachages. Je n'ai pas osé remplacer les adresses restantes dans le texte par des liens, mais j'ai fait un simple remplacement par des adresses comme vasya_at_pupkin_dot_ru. Le code de remplacement automatique est également dans l'archive.

Conclusion

Cacher les adresses e-mail des visiteurs est assez simple. Le mécanisme de correction automatique ne nécessite aucun effort supplémentaire et vous pouvez continuer à rédiger les pages du site comme si de rien n'était. Des difficultés surviennent lors de la protection de l'expéditeur du formulaire contre les hooligans du Web. Cette protection nécessite beaucoup d'efforts et un code complexe, je n'ai donc pas encore utilisé de code écrit sur le site. Vous pouvez télécharger une archive avec un substitut d'adresse et un expéditeur de formulaire, mais je vous le demande beaucoup : ne la mettez pas sur votre site sous la forme dans laquelle vous l'avez téléchargée, je ne sais pas moi-même à quel point cela fonctionne de manière fiable.

Publications sur le sujet