This page has been robot translated, sorry for typos if any. Original content here.

Tricher les moteurs de recherche ou accroître la pertinence des sites Web

Entrée

Principe de fonctionnement

Triche moteur de recherche

Augmenter la pertinence

Conclusion

Entrée

Aujourd'hui, trouver la bonne information sur Internet devient de plus en plus difficile. La raison en est l'énorme augmentation du nombre de sites et une croissance encore plus importante de la malbouffe de l'information et de la publicité. Combien de fois avez-vous dû faire une requête dans votre moteur de recherche préféré pour trouver la dernière chanson de votre artiste préféré ou le meilleur site xxx? Et combien de fois avez-vous observé que le résultat de la recherche est complètement indépendant de la requête? Au lieu d'une nouvelle chanson, il vous est proposé d'entrer dans la pyramide financière et, au lieu du meilleur site xxx, de commander une fille à des prix extrêmement bas avec livraison à domicile. Tout cela est le résultat de robots de recherche tricherie. Les méthodes de triche et d’augmentation du classement du site dans les moteurs de recherche sont décrites dans cet article.

Principe de fonctionnement

Voici un exemple typique d'un moteur de recherche ordinaire. Un module logiciel (araignée) parcourt les liens, lit le contenu des pages et crée une entrée dans chaque fichier d’index. Par exemple, pour le mot "billet de faveur", quelque chose comme ceci sera créé dans le fichier d'index: "freebie1". Ensuite, dans le fichier où les liens sont stockés, l’entrée “1 page URL” sera créée. Explication: 1 est le numéro qui relie les entrées du fichier d'index (table) et du fichier de liaison. Ensuite, l'araignée rampera vers une autre page et tombera là encore sur le mot "billet de faveur". Maintenant, dans la table d'index, il créera une entrée: "freebie12", et dans la table de liens: "2 URL de page". Lorsque l'utilisateur tape le mot "billet de faveur" dans la barre de recherche, le moteur de recherche examinera le fichier d'index, y trouvera la ligne "billet de faveur", lira les numéros 12 et trouvera les adresses correspondant aux numéros 1 et 2 dans la table des liens et les donnera à l'utilisateur. Voici le principe de base des moteurs de recherche, appelé indexation. Qu'est-ce qui détermine alors la position des sites dans la recherche? Réponse: de pertinence, c'est-à-dire de la correspondance du document à la demande de l'utilisateur. De quoi dépend la pertinence? En général, les algorithmes d'évaluation de la pertinence diffèrent d'un moteur de recherche à l'autre et sont maintenus dans la plus grande confidentialité. Voici les principales options:

  • Le nombre de mots répétés dans le document.
  • Les mots-clés sont inclus dans les balises ,,,,. I.e. si la page est associée à un billet de faveur, il est préférable d'écrire le mot "billet de faveur" entre les balises, et dans le texte suivant, mettez ce mot en surbrillance.
  • La distance entre les mots-clés dans le document. Plus la distance est petite, plus la pertinence est grande.
  • Index de citation - une valeur indiquant le nombre de liens d'autres ressources vers ce site. Plus le nombre de sites liés à cette ressource est élevé, plus l'indice de citation est élevé. La popularité du site à partir duquel le lien est également important.
  • Un paramètre également important: l'épaisseur du portefeuille du propriétaire de la ressource. Les moteurs de recherche sont fabriqués par des personnes qui veulent aussi manger, boire de la bière, acheter le magazine Hacker. Et ils affichent des annonces directement dans les résultats de recherche. Les liens payants apparaissant dans les premières lignes du résultat de la recherche ne s'avèrent pas très souvent pertinents pour la demande.

Naturellement, plus la pertinence est élevée, plus le site sera élevé à la suite de la recherche et plus la probabilité que l'utilisateur le visite sur ce site est grande. Par conséquent, vous vous demandez comment augmenter la pertinence des moteurs de recherche.

Triche moteur de recherche

En général, il est assez difficile de tromper le moteur de recherche moderne, et chaque jour, il devient de plus en plus difficile. Au début, je dirai ce que vous ne pouvez pas faire:

  • Utilisez des mots clés qui ne sont pas liés au sujet de la page. Des mots-clés ont été inventés pour faciliter le processus d'indexation. De par leur conception, les webmasters ont placé dans la balise les mots qui reflétaient le mieux le contenu de leurs pages. Ensuite, le spam sur le réseau n’était plus aussi répandu qu’aujourd’hui et, au début, les mots-clés ont réellement aidé à trouver les informations nécessaires. Mais ensuite, les créateurs de sites ont commencé à insérer dans cette balise les mots les plus populaires tapés lors de la recherche sur Internet, dans l’espoir que les visiteurs accèdent à leur site. La plupart des moteurs de recherche ont appris à gérer ce type de courrier indésirable: à présent, les araignées ont commencé à analyser tout le texte de la page et à le comparer au texte des mots-clés. S'il n'y avait pas de correspondance, la page n'était pas indexée. Par conséquent, cela n'a aucun sens d'inclure des mots clés qui ne figurent pas sur la page;
  • Utilisez un mot clé plusieurs fois. L'araignée prendra cela comme spam et arrêtera d'indexer la page.
  • Placez des mots clés populaires sur la page, par exemple: Internet, programmes, ordinateur, photo. Souvent, le moteur de recherche ignore simplement ces mots, car ils ont déjà chargé des dizaines de millions d'autres pages.
  • Utilisez une couleur de texte égale à la couleur de fond. Auparavant, les spammeurs utilisaient souvent cette méthode. Ainsi, ils réussirent à cacher les mots au visiteur, mais les laissèrent visibles aux araignées. La plupart des moteurs de recherche peuvent traiter cela. Ils comparent la couleur d'arrière-plan de la balise avec la couleur du texte. Si les valeurs sont égales, l'indexation s'arrête. Certains spammeurs font ceci: ils spécifient dans la balise, par exemple bleu, la couleur du texte est blanc, puis la balise suivante est indiquée: où fon.gif est une petite image en blanc. Le fait est que le navigateur utilisera le fichier fon.gif pour afficher l’arrière-plan de la page et le rendra blanc. Aucun mot ne sera visible, tandis que l’araignée affichera la couleur d’arrière-plan bleue. Cette méthode a un revers: de nombreux utilisateurs dans notre pays ne peuvent pas se vanter d’une connexion rapide, et donc désactivent souvent le chargement de graphiques, et leur navigateur affiche la couleur de fond telle qu’elle est indiquée dans la balise, c.-à-d. dans notre exemple, en bleu, le visiteur verra tous les mots destinés au robot de recherche.
    Placez les mots-clés dans un calque séparé (calque) et rendez-le invisible.
  • Utilisez des redirecteurs sur la page type. Cette balise redirigera le visiteur vers le site http://ca1.dax.ru/ 5 secondes après son chargement. La plupart des moteurs de recherche perçoivent cela comme du spam. Cet exemple est souvent utilisé par les sites xxx, plaçant de nombreux mots clés sur la page, et le visiteur est presque immédiatement envoyé à une autre ressource.

Augmenter la pertinence

Passons maintenant à ce qui doit être fait pour vraiment augmenter la pertinence d’une ressource:

  • Enregistrez indépendamment des mots-clés sur chaque page du site, en essayant d'optimiser leur pertinence par rapport au sujet de la page;
  • Ne mettez pas de virgule après les mots-clés. Premièrement, cela augmente la taille du fichier, deuxièmement, la plupart des moteurs de recherche ne lisent que les 200 à 250 premiers caractères;
  • Prioriser les mots en fonction de leur importance. Les mots les plus importants doivent venir en premier;
  • Il est préférable que les mots utilisés dans les balises ,,,, ainsi que dans l'attribut ALT soient trouvés dans des mots-clés;
  • Ne répétez pas les mots-clés sur différentes pages du site;
  • Certains moteurs de recherche affichent une description de page à partir d'une balise et certaines des premières lignes d'un document. La description doit être faite pour que l'utilisateur veuille aller sur le site. Si vous ne souhaitez pas adapter les premières lignes de texte de la page à la description, vous pouvez opter pour une astuce. Créez un calque invisible à l'aide de styles de table en cascade (CSS) et placez-le après la balise. T.O. un moteur de recherche affichant les premières lignes d'un document affichera le texte dans un calque invisible. Il est à noter que vous ne devriez pas faire une description détaillée de la page, car les moteurs de recherche affichent généralement uniquement les 170 premiers caractères.
  • Les robots de recherche ne traitent pas bien les tables.
  • Sur chaque page, utilisez autant de liens que possible vers d'autres pages de votre ressource et le moins possible vers des pages d'autres sites.

Comme je l'ai dit précédemment, les scores de pertinence varient selon les moteurs de recherche. Plus de 90% de toutes les demandes dans le monde n'utilisent qu'une douzaine de moteurs de recherche. Il est donc logique de prendre en compte la technologie du plus populaire d'entre eux.

Yandex

Aujourd'hui, le moteur de recherche le plus populaire en Russie. Le nombre de réponses Yandex aux requêtes de recherche a dépassé 147 millions. Selon l'entreprise, Yandex est prêt à donner à chaque citoyen russe une réponse par mois. L'araignée de recherche Yandex est réputée pour sa rapidité de travail. Après quelques heures à peine, la page indexée devient disponible dans les résultats de la recherche.

Conseils d'optimisation de page pour Yandex

Les pages doivent être de taille moyenne, riches en texte, il ne doit pas y avoir beaucoup de mots-clés. Les mots de l'abréviation ALT valent un ordre de grandeur inférieur à celui des mots-clés. Les pages créées par les scripts sont bien indexées: livres d’or, forums, forums, ainsi que les pages situées sur l’hébergement gratuit narod.ru.

Rambler

L'un des moteurs de recherche les plus récents, dont le développement a pris en compte l'expérience d'autres moteurs de recherche. Le robot randonneur télécharge environ 2 millions de pages par jour. Lors de l'indexation, les mots clés ne sont pas traités et seuls ceux que le visiteur peut voir à l'écran sont traités. À la suite de la recherche, la préférence est donnée aux sites inscrits dans le catalogue Rambler Top100.

Aport

À partir du moment où un site est ajouté à Aport jusqu'à ce qu'il apparaisse dans la base de recherche, cela prend de deux à trois jours à deux semaines. Il n'indexe pas les pages à l'adresse desquelles se trouve le symbole “?”. En plus du texte visible par le visiteur, Aport indexe le titre du document (TITLE), les mots-clés (META KEYWORDS), les descriptions de page (META DESCRIPTION) et les légendes d’image (ALT). En outre, Aport indique comment les liens hypertextes vers ce document appartiennent au document à partir d'autres pages situées à la fois sur le site et hors de celui-ci, ainsi que des descriptions de sites Web compilées (ou vérifiées) par les éditeurs du catalogue.

Google

La pertinence de Google dépend de:

  • indice de citation;
  • mots-clés
  • mots-clés dans les liens;
  • mots en surbrillance.

Le robot de recherche Google se distingue par sa capacité à indexer en profondeur le site, c.-à-d. il essaie de couvrir le nombre maximum de liens d'une page.

Altavista

Fonctionnalités de recherche sur AltaVista: la présence de mots-clés dans l’étiquette, ainsi que les légendes d’image (ALT) jouent un rôle important. Les mots clés jouent un rôle important dans les 1000 premiers caractères.

Conclusion

Eh bien, c’est tout. Je tiens à noter que l'optimisation des pages pour les moteurs de recherche est peut-être l'étape la plus importante de la promotion de sites Web. Vous pouvez tromper un moteur de recherche, mais vous vous demandez si vous en avez besoin? Après tout, vous n'obtiendrez rien d'autre que la réaction négative du visiteur. Un site correctement optimisé attirera un public beaucoup plus actif. Ce trafic est d'une très grande qualité et revêt une grande valeur, car l'utilisateur vient sur votre site avec un objectif et des intentions spécifiques.