Google PageRank

PageRank : tout ce qu’il faut savoir sur l’algorithme de Google

| Référencement naturel

Elément fondateur de l’algorithme de Google, le PageRank est une formule mathématique permettant d’évaluer la popularité d’une page web grâce aux liens qu’elle reçoit. D’où vient son nom ? Comment est-il calculé ? Quel impact a t-il sur le référencement naturel d’un site ? Peut-on connaître exactement le PageRank d’une page ? Nous répondons à toutes vos questions.

Définition du PageRank

Le Pagerank est l’élément central de l’algorithme de Google. Il s’agit d’une formule logarithmique permettant de mesurer la popularité de chaque page d’un site web en fonction de la quantité et de la qualité des liens qu’elle reçoit.

Plus une page a un Pagerank élevé (note de 1 à 10), plus elle a de chances de bien se positionner dans les résultats de recherche.

A l’époque, cet indicateur était accessible par tout le monde grâce notamment à la barre d’outils « Google Toolbar » (illustration ci-dessous), jusqu’à ce que le moteur de recherche décide de ne plus le rendre publique en 2016. PageRank fait toujours partie à l’heure actuelle de l’algorithme de Google même s’il a connu quelques évolutions.

Google Toolbar PageRank
La Toolbar PageRank de Google (TBPR) – Source : mangools

Origine du nom PageRank

Ce système de classement fut développé en 1997 à l’Université de Stanford par l’un des deux fondateurs de Google, Larry Page. Il tire son nom de son inventeur. Il a fait l’objet d’un brevet, Method for Node Ranking in a Linked Database, déposé la même année.

La fondation nationale américaine pour la science (National Science Foundation) a financé une partie du projet, lui accordant ainsi certains droits sur l’invention.

Comment fonctionne l’algorithme PageRank ?

Larry Page a pensé le fonctionnement du Pagerank en s’inspirant du Science Citation Index, indice de citation créé par Eugene Garfield en 1964. Cet indice sert à déterminer le classement des contenus scientifiques en se basant sur le nombre de fois que d’autres contenus y font référence.

Larry Page a ainsi répliqué ce système sur le web en considérant les liens hypertextes comme des « références » à un autre contenu, en quelque sorte des votes de confiance. Ainsi, plus une page reçoit de liens entrants, plus elle sera considérée comme une page faisant autorité, et son classement s’en verra amélioré dans les résultats de recherche de Google. Cependant tous les liens ne se valent pas aux yeux du moteur américain et la quantité ne fait pas tout. La notion de qualité des liens entrants est également prépondérante dans l’algorithme.

La qualité d’un lien dépend de plusieurs facteurs :

  • L’autorité du site pointant vers la page : un site qui a un PageRank de 8/10 transmettra davantage d’autorité qu’un site ayant un PageRank de 2/10 ;
  • La thématique du site de provenance du lien est-elle similaire à la page de destination ?
  • L’ancre (texte cliquable du lien) utilisée est-elle pertinente ?
  • La position du lien sur la page
  • Le lien est-il en dofollow, pour qu’il puisse être pris en compte par Google et transmettre ce que l’on appelle le « jus seo » ?

Les liens ont donc une importance capitale dans le référencement naturel. C’est pour cette raison que des stratégies de netlinking sont mises en place par les référenceurs.

Surfeur aléatoire vs Surfeur raisonnable

Pour comprendre la notion de PageRank, il est également important d’appréhender les notions de « surfeur aléatoire » et « surfeur raisonnable ». Au tout début, Google accordait le même poids à chaque lien présent sur une page, partant du principe qu’ils avaient la même probabilité d’être cliqués. On parlait alors de « surfeur aléatoire ».

En 2010, Google a affiné son algorithme qui prend désormais davantage en compte le comportement réel d’un internaute sur une page web. On parle alors de « surfeur raisonnable ». Quand ce dernier navigue sur une page, il est beaucoup plus probable qu’il clique sur un lien situé en haut de la page ou au sein du contenu. Google considère ainsi que ces liens sont plus importants que ceux situés en bas de page (footer) ou sur le côté. La position et la contextualisation du lien deviennent donc des critères importants pour évaluer sa popularité.

Comment est calculé le PageRank ?

La formule mathématique du PageRank est la suivante :

PR(B) = (1-d) + d ( PR(A1) / C(A1) + …. + PR(An) / C(An) )

  • « PR » signifie PageRank
  • La page B reçoit des liens provenant de différentes pages A1, A2, A3, … An
  • « C » est le nombre de liens sortants présents sur une même page
  • « d » est un facteur d’amortissement, google partant du principe que l’internaute ne clique pas systématiquement sur un lien. Il s’agit d’une sorte de pondération entre 0 et 1, souvent équivalente à 0,85. Le PageRank n’est donc pas transmis en totalité.
Facteur d'amortissement du PageRank
Facteur d’amortissement du PageRank – source : Polemic Digital

Pour simplifier la compréhension de la formule, le PageRank de la page B est calculé selon 3 critères :

  • Le nombre de pages (An) effectuant des liens vers la page B ;
  • Le PageRank des pages en question => PR(An) ;
  • Le nombre de liens sortants qu’effectuent ces pages vers d’autres sites (C), le « jus seo » envoyé est ainsi partagé entre les différents liens.

Le tout est pondéré par le facteur d’amortissement « d » (probabilité de clic).

Ainsi plus les PageRank des pages « An » sont élevés, plus la page B aura un PageRank élevé. Logique !

Circulation du Pagerank
Transfert de PageRank entre différentes pages

Quelle est l’importance du PageRank dans le référencement naturel ?

Google utilise plus de 200 critères pour classer les pages web sur son moteur de recherche. La popularité d’un site web est l’un des 3 piliers du SEO avec les optimisations techniques et le contenu.

Le contenu que vous allez produire déterminera les mots clés sur lesquels vous allez ressortir sur les différents moteurs de recherche. Les backlinks, quant à eux, indiqueront que votre contenu est digne de confiance et augmenteront la popularité de vos pages et l’autorité globale de votre site.

Le PageRank est donc très important en SEO, même s’il est loin d’être le seul critère de classement.

Pagerank externe vs Pagerank interne

Quand on évoque le PageRank, on parle souvent du PageRank externe, qui a été décrit ci-dessus et qui est construit grâce aux liens provenant d’autres sites web. Mais il existe également ce que l’on appelle le « PageRank interne ». Ce concept permet de définir l’importance ou le poids des pages de votre site les unes par rapport aux autres. Au même titre que le PageRank externe, le PageRank interne dépend directement du nombre et de la qualité des liens internes pointant vers les pages de votre site.

Vous avez acquis de la popularité (du jus seo) grâce notamment à des backlinks de qualité ? Il est primordial de faire « circuler ce jus » au sein de votre site en effectuant des liens cohérents entre vos différentes pages. C’est ce que l’on appelle l’optimisation du maillage interne d’un site. Trop souvent délaissé par les éditeurs de site, une grande attention doit y être apportée afin de capitaliser sur les efforts consentis en matière de netlinking. Le maillage interne vous permet de partager et distribuer le jus seo au sein de votre site et d’indiquer au robot de Google les pages les plus importantes à explorer.

Comment connaître son PageRank ?

Jusqu’en 2013, il était possible d’avoir une estimation du PageRank d’une page grâce à la barre d’outils Google (Google Toolbar) qui affichait une petite jauge verte avec une graduation de 1 à 10 (10 étant le meilleur PageRank). En 2013, Google a cessé de mettre à jour cet indicateur avant de définitivement supprimer le Google Toolbar PageRank en 2016.

Dans tous les cas de figure, il est impossible de connaître exactement le PageRank d’une page. Certains acteurs du référencement ont développé ces dernières années des indicateurs alternatifs pouvant vous renseigner sur le niveau de popularité d’une page ou d’un site (ou domaine). En voici quelques-uns, utilisant tous un score de 0 à 100 :

  • Le Page Authority (PA) et Domain Authority (DA) de l’outil SEO Moz, indiquant l’autorité d’une page et d’un domaine ;
  • Le Trust Flow (TF) et Citation Flow (CF) de Majestic, correspond respectivement à la qualité et la quantité des liens d’un site internet ;
  • L’Authority score (AS) de SEMrush qui évalue l’autorité d’un domaine ;
  • Le Domain Rating (DR) d’Ahrefs qui consiste également à évaluer l’autorité d’un site web.

En conclusion, le PageRank a toujours été au cœur du fonctionnement de l’algorithme de Google et le restera encore longtemps. Le simple fait de l’évoquer nous rappelle toute l’importance des liens dans le référencement naturel. C’est grâce aux liens que Google explore le web, évalue la popularité de milliards de pages internet, et détermine en partie le classement de ses résultats de recherche. Alors mieux vaut les soigner !


Florian Geri

Auteur

Florian Geri

Partager: