This page has been robot translated, sorry for typos if any. Original content here.

Tricher les moteurs de recherche ou augmenter la pertinence du site

Entrée

Principe de fonctionnement

Triche des moteurs de recherche

Augmenter la pertinence

Conclusion

Entrée

Aujourd'hui, trouver la bonne information sur Internet devient de plus en plus difficile. La raison en est une énorme augmentation du nombre de sites et une augmentation encore plus importante des déchets d'information, de la publicité. Combien de fois avez-vous demandé à votre moteur de recherche préféré de rechercher la dernière chanson de votre artiste préféré ou le meilleur site xxx? Et combien de fois avez-vous constaté que le résultat de la recherche n'était pas du tout lié à la requête? Au lieu d'une nouvelle chanson, vous êtes invité à entrer dans la pyramide financière et à la place du meilleur site xxx, vous pouvez commander une fille à des prix extrêmement bas avec livraison à domicile. Tout cela est le résultat de la tromperie des robots de recherche. Sur les méthodes de triche et d'amélioration du classement du site dans les moteurs de recherche décrits dans cet article.

Principe de fonctionnement

Voici un exemple typique d'un moteur de recherche ordinaire. Il existe un module logiciel (araignée, araignée) qui parcourt les liens, lit le contenu des pages et crée pour chaque mot une entrée dans le fichier d'index. Par exemple, pour le mot “billet de faveur”, quelque chose comme ceci serait créé dans le fichier d'index: “billet de faveur1”. Ensuite, dans le fichier où les liens sont stockés, sera enregistré "1 URL de la page". Explication: 1 correspond au numéro qui relie les enregistrements du fichier d'index (table) et du fichier de liaison. Ensuite, l'araignée va ramper vers une autre page et y tomber à nouveau sur le mot "billet de faveur". Maintenant, dans la table d'index, il créera une entrée: «freebie12» et dans la table de référence: «2 URL de la page». Lorsque l'utilisateur tape le mot «billet de faveur» dans le champ de recherche, le moteur de recherche examinera le fichier d'index, y trouvera la ligne «billet de faveur», lira les numéros 12 et trouvera les adresses dans le tableau de référence correspondant aux numéros 1 et 2 et les donnera à l'utilisateur. Voici le principe de base des moteurs de recherche, appelé indexation. Qu'est-ce qui détermine alors la position des sites dans le résultat de la recherche? La réponse est: pertinence, c.-à-d. de la conformité du document avec la demande de l'utilisateur. De quoi dépend la pertinence? En général, les algorithmes d'évaluation de la pertinence diffèrent d'un moteur de recherche à l'autre et sont maintenus dans la plus grande confidentialité. Voici les paramètres de base:

  • Le nombre de mots en double dans un document.
  • Les mots-clés sont inclus dans les balises ,,,,. C'est à dire si la page est associée à un billet de faveur, il est préférable d'écrire le mot «billet de faveur» entre les balises et dans le texte suivant pour mettre en surbrillance ce mot.
  • La distance entre les mots-clés dans le document. Plus la distance est petite, plus la pertinence est grande.
  • L'index de citation est une valeur indiquant le nombre de liens d'autres ressources vers ce site. Plus le nombre de sites liés à cette ressource est élevé, plus l'indice de citation est élevé. C'est important et la popularité du site d'où provient le lien.
  • Paramètre non moins important: l'épaisseur du portefeuille du propriétaire de la ressource. Les moteurs de recherche permettent aux gens qui veulent aussi manger, boire de la bière, d’acheter un magazine "Hacker". Et ils affichent des annonces directement dans les résultats de recherche. Les liens payants apparaissant dans les premières lignes du résultat de la recherche ne sont pas souvent pertinents pour la requête.

Naturellement, plus la pertinence est élevée, plus le site sera élevé à la suite de la recherche et plus la probabilité que l'utilisateur accède à ce site est grande. Par conséquent, vous vous demandez comment augmenter la pertinence des moteurs de recherche.

Triche des moteurs de recherche

En général, il est assez difficile de tromper un moteur de recherche moderne, et chaque jour cela devient de plus en plus difficile. Au début, je dirai ce qui ne peut pas être fait:

  • Utilisez des mots clés non liés au sujet de la page. Des mots-clés ont été conçus pour faciliter le processus d'indexation. Selon le plan, les webmasters insèrent dans la balise des mots reflétant le mieux le contenu de leurs pages. À cette époque, le spam sur le Web n’était pas aussi répandu qu’aujourd’hui et, au début, les mots-clés ont réellement aidé à trouver les informations nécessaires. Mais ensuite, les créateurs de sites ont commencé à insérer les mots les plus populaires dans cette balise, qui ont été saisis lors de la recherche sur Internet, dans l’espoir que les visiteurs accèdent à leur site. La plupart des moteurs de recherche ont appris à lutter contre ce type de courrier indésirable: à présent, les araignées ont commencé à analyser tout le texte de la page et à le comparer au texte contenu dans les mots-clés. S'il n'y avait pas de correspondance, la page n'était pas indexée. Par conséquent, cela n'a aucun sens d'inclure des mots clés qui ne figurent pas sur la page.
  • Utilisez un mot clé plusieurs fois. L'araignée le prendra comme spam et arrêtera d'indexer la page.
  • Placez sur la page des mots-clés populaires, par exemple: Internet, programmes, ordinateur, photo. Souvent, le robot de recherche ignore simplement ces mots, car ils ont déjà chargé des dizaines de millions d'autres pages;
  • Utilisez une couleur de texte égale à la couleur de fond. Auparavant, cette méthode était souvent utilisée par les spammeurs. Ainsi, ils ont réussi à cacher les mots du visiteur, mais les ont laissé visibles aux araignées. La plupart des moteurs de recherche peuvent traiter cela. Ils comparent la couleur d'arrière-plan de la balise avec la couleur du texte. Si les valeurs sont égales, l'indexation s'arrête. Certains spammeurs font ceci: ils sont définis dans la balise, par exemple en bleu, rendent la couleur du texte blanche, puis indiquent la balise suivante :, où fon.gif est un petit dessin en blanc. Le fait est que le navigateur utilisera le fichier fon.gif pour afficher l’arrière-plan de la page, et rendra l’arrière-plan blanc. Aucun mot ne sera visible, alors que la couleur de fond de l’araignée apparaîtra en bleu. Cette méthode présente un inconvénient: de nombreux utilisateurs de notre pays ne peuvent pas se vanter d’une connexion rapide, et désactivent donc souvent le téléchargement de graphiques, et leur navigateur affiche la couleur de fond telle qu’elle apparaît dans la balise, c.-à-d. dans notre exemple, bleu, et le visiteur verra tous les mots destinés au robot de recherche.
    Placez les mots-clés dans un calque séparé (calque) et rendez-le invisible.
  • Utilisez les redirecteurs sur la page type. Cette balise redirigera le visiteur vers le site http://ca1.dax.ru/ dans les 5 secondes suivant le téléchargement. La plupart des moteurs de recherche perçoivent cela comme du spam. Cet exemple est souvent utilisé par les sites xxx, plaçant de nombreux mots clés sur une page, et le visiteur est presque immédiatement envoyé à une autre ressource.

Augmenter la pertinence

Maintenant, cela doit être fait pour vraiment augmenter la pertinence de la ressource:

  • Pour enregistrer indépendamment les mots-clés sur chaque page du site, essayez de vous assurer qu'ils correspondent le plus fidèlement possible au thème de la page;
  • Ne mettez pas de virgule après les mots-clés. Premièrement, la taille du fichier augmente, et deuxièmement, la plupart des moteurs de recherche ne lisent que les 200 à 250 premiers caractères;
  • Faites une séquence de mots en fonction de leur importance. Les mots les plus importants devraient être au début;
  • Il est préférable que les mots utilisés dans les balises ,,,, ainsi que dans l'attribut ALT apparaissent dans les mots-clés;
  • Ne répétez pas les mots-clés sur différentes pages du site;
  • Certains moteurs de recherche affichent la description de la page à partir de la balise, ainsi que certaines des premières lignes du document. La description doit être faite pour que l'utilisateur veuille aller sur le site. Si vous ne souhaitez pas adapter les premières lignes de texte de la page à la description, vous pouvez tenter votre chance. Créez un calque invisible à l'aide de feuilles de style en cascade (CSS) et placez-le après la balise. Donc Un moteur de recherche affichant les premières lignes du document affichera le texte dans un calque invisible. Il est à noter que vous ne devriez pas faire une bonne description de la page, car les moteurs de recherche affichent généralement uniquement les 170 premiers caractères.
  • Les robots de recherche traitent mal les tables.
  • Sur chaque page, utilisez autant que possible des liens vers d'autres pages de votre ressource et le moins possible vers des pages d'autres sites.

Comme je l'ai dit, le score de pertinence varie d'un moteur de recherche à l'autre. Plus de 90% de toutes les demandes dans le monde ne représentent que quelques dizaines de moteurs de recherche. Il est donc logique de prendre en compte la technologie des plus populaires.

Yandex

Aujourd'hui, le moteur de recherche le plus populaire en Russie. Le nombre de réponses de Yandex aux requêtes de recherche a dépassé 147 millions. Selon la société, Yandex est prête à donner à chaque résident de Russie une réponse par mois. L'araignée de recherche Yandex est célèbre pour sa rapidité de travail. Après plusieurs heures, la page indexée devient disponible dans les résultats de la recherche.

Conseils sur l'optimisation des pages pour Yandex

Les pages doivent être de taille moyenne, riches en texte, les mots-clés ne doivent pas être trop. Les mots de l'abréviation ALT ont une valeur inférieure à celle des mots clés. Les pages créées par les scripts sont bien indexées: livres d'or, forums de discussion, forums, ainsi que les pages hébergées sur l'hébergement gratuit narod.ru.

Rambler

L'un des plus jeunes moteurs de recherche, dont le développement a été pris en compte par l'expérience d'autres moteurs de recherche. Le robot Daily Rabbler télécharge environ 2 millions de pages. Lors de l'indexation, les mots-clés ne sont pas traités et seuls ceux qu'un visiteur peut voir à l'écran sont traités. À la suite de la recherche, la préférence est donnée aux sites inscrits dans le catalogue Rambler Top100.

Aport

À partir du moment où le site est ajouté à Aport jusqu'à son apparition dans la base de données de recherche, il faut compter entre deux, trois jours et deux semaines. Il n'indexe pas les pages avec le «?» Dans leur adresse. Outre le texte visible par le visiteur, Aport indexe également le titre du document (TITLE), les mots-clés (META KEYWORDS), les descriptions de page (META DESCRIPTION) et les légendes d’image (ALT). En outre, Aport indexe les liens hypertexte vers ce document à partir de pages différentes, à l'intérieur et à l'extérieur du site, ainsi que des éditeurs compilés (ou vérifiés) décrivant les sites du catalogue.

Google

La pertinence de Google dépend de:

  • indice de citation;
  • mots-clés;
  • mots-clés dans les liens;
  • mots en surbrillance.

Le robot de recherche Google se distingue par sa capacité à indexer en profondeur un site, c.-à-d. Il essaie de couvrir le nombre maximum de liens d'une page.

Altavista

Caractéristiques de la recherche sur AltaVista: un rôle important est joué par la présence de mots-clés dans l’étiquette, ainsi que par des légendes d’images (ALT). Rôle important joué par les mots-clés dans les 1000 premiers caractères.

Conclusion

C'est tout. Je tiens à noter que l'optimisation des pages pour les moteurs de recherche est probablement l'étape la plus importante de la promotion de sites Web. Vous pouvez tromper le moteur de recherche, mais vous vous demandez si vous en avez besoin? Après tout, rien que la réaction négative du visiteur que vous ne réaliserez pas. Un site correctement optimisé attirera un public beaucoup plus actif. Ce trafic est de très haute qualité et très apprécié, car l'utilisateur vient sur votre site avec un objectif et une intention spécifiques.