L’audit SEO en détail

Audit SEO : piège à pigeons

Dès que l’on évoque une prestation SEO, on parle inévitablement d’audit. Il faut dire que c’est une étape importante dans le processus d’une prestation en référencement naturel. Nul ne peut entreprendre un travail de référencement pour un tiers sans analyser à minima l’existant. Là-dessus, tout le monde devrait être en phase.
Mais de vous à moi, avez-vous déjà eu des clients sachant exactement en quoi consistait un audit de site web ? Probablement pas, et cela peut se comprendre.

Et vous, qui baignez dans le jus du SEO, savez-vous réellement en quoi consiste un audit ?
Manifestement, cela reste un concept aux contours très flous pour quelques-uns… pour ne pas dire beaucoup. Pire, des consultants et agences peu scrupuleux facturent lourdement des audits qui, bien souvent, ne leur demande pas la moindre goutte de jus de cervelle, un peu à l’image des garagistes véreux qui facturent 500€ une révision de voiture avec en guise de prestation beaucoup de baratin et une simple vidange.

Avant de dresser une liste de tous les points de contrôle à analyser, il faut avant tout déterminer la fonction première de l’audit pour le prestataire et le client. Véritable état des lieux, il est réalisé en amont de la prestation, et permet d’avoir une meilleure visibilité du chantier, d’évaluer sa durée, de faire ressortir les éléments défaillants du site, et les leviers sous-exploités. De même, il permet d’informer le client sur la faisabilité de ses ambitions (positionnement et concurrence).

Quand un client vient vers moi pour une prestation en référencement, ou pour reprendre son site internet, avant d’établir un devis, je fais un pré-audit basique de son site pour évaluer la faisabilité de son projet et de ses attentes. Juste par curiosité et pour ma culture, je trouve toujours enrichissant d’auditer des sites, qu’ils soient pénalisés ou pas. De fait, le travail de l’audit est quasiment fait avant toute formalité contractuelles (à l’exception des gros sites). Et ne nous racontons pas d’histoire, une grande partie de l’analyse technique peut être automatisée grâce à des outils comme SEO powersuite ou Advanced Web Ranking, et ne demande guère de temps « humain ».

J’entends déjà des voix s’élever pour me dire qu’un audit réclame souvent plus d’une journée de travail, nécessitant une analyse en profondeur, comprendre la structure sémantique du site surtout quand ils sont très gros… et c’est complètement vrai ! Sauf qu’il y a deux poids deux mesures, et c’est là que les embrouilles commencent.

L’audit du fainéant

Facturer un audit technique au prix d’un véritable audit complet ou en partie (technique, sémantique, concurrence, linking), c’est de l’arnaque.

Le « boulot » se résumant à saisir l’url du site à analyser avec un logiciel dédié, cliquer sur un bouton… et laisser le travail se faire tout seul en tâche de fond. En quelques minutes, vous dressez toutes les erreurs 404, les redirections, les metas de chaque page, les balises title, les PR, la taille des pages et j’en passe, le tout présenté aux petits oignons avec camemberts et courbes pour illustrer le tout. Présentation nickel, ça claque, c’est beau… mais ça ne vaut pas un rond.

Il n’y a pas de mal à se contenter d’un audit purement technique et automatisé, du moment que les choses sont clairement définies au départ et facturées raisonnablement. Après tout, il n’y a pas de règle, chacun déterminera ses propres limites en fonction du profil du client, et de l’envergure du site à analyser.

Mais pour être vraiment efficace, un audit sera plus productif s’il est exhaustif. C’est ballot de passer plusieurs heures à retourner un site dans tous les sens, si vous passez à côté du détail qui pénalise l’ensemble du domaine. Les scenarii sont nombreux, mais imaginons que vous deviez passer après un autre référenceur qui à première vue a tout fait dans les règles de l’art, mais a laissé (volontairement ou non) quelques cloaking ici ou là, voir des éléments CSS invisibles plus que border-line. Dans ce cas les outils d’audit existants ne verront probablement rien. Votre travail d’analyse ne servira pratiquement à rien, et le facturer serait presque indécent.

Il faut donc faire preuve de discernement et de vigilance. L’analyse d’un site est à géométrie extrêmement variable, et ses contours relativement flous (surtout pour les clients) font de ce poste un véritable piège à pigeons.

Passons au concret, le contenu de l’audit SEO

Distinguons 5 grands axes pour réaliser un audit orienté SEO complet et exhaustif :

  1. l’analyse de la partie technique, entièrement automatisable avec des logiciels dédiés.
  2. l’analyse sémantique et le contenu, le choix des mots clés, la structure du site, la navigation et le maillage interne.
  3. l’analyse off-site qui englobe le linking, le positionnement sur les occurrences stratégiques, et l’activité sur les réseaux sociaux. Là aussi la collecte des informations peut et doit-être automatisée au maximum.
  4. L’analyse de la concurrence : travailler dans une niche concurrentielle demande beaucoup plus d’efforts, d’analyse et de temps.
  5. Le modèle économique : certains modes de monétisation n’ont plus la côte auprès du grand Google, qu’on se le dise ! Par exemple, se montrer trop gourmand avec de l’affiliation peut être fatal pour un site. Le modèle économique influence également les stratégies (SEO/SEM) qui seront mises en place.

Autant il est important de différencier les différentes facettes d’un audit web, autant il faut bien discerner le profil de votre client et la nature de son projet. Le déroulement d’un audit, et d’une prestation ne se déroule pas de la même façon pour un client n’ayant aucune connaissance technique/SEO, et une structure ayant déjà une cellule marketing et recherchant une compétence extérieure pour avoir un autre regard sur l’état de leur présence sur le web. Dans le premier cas il est malhonnête de facturer un audit technique de base, de l’autre, vous ferez pâle figue en ne proposant qu’un audit technique basique et passif, qui plus est payant.

Liste des aspects techniques qui peuvent être récoltés sur un site :

Update 13/04/2013 : Après mûres réflexions, j’ai pris la décision de retirer certains points de contrôle de la checklist ci-dessous. En effet, je constate avec le recul qu’en donnant la recette complète de l’audit (technique), beaucoup de personnes « naïves » pensent pouvoir analyser leur site par elles-mêmes, et prendre les bonnes directives qui s’imposent. Or si un bon audit technique doit effectivement se reposer sur une bonne checklist, le travail d’analyse et d’interprétation repose sur des éléments fondamentaux comme l’expérience, le savoir-faire, la faculté d’anticipation, la perception des algorithmes de Google, et j’en passe. Bref, c’est une affaire de professionnels.

Ceux qui espèrent avoir la recette de l’audit « tout cuit », n’y trouveront certainement pas leur compte, et surtout cela fait du tort à mon business, et à celui de mes confrères. L’expertise et le conseil cela se paie, et c’est ce qui me fait vivre. Si vous souhaitez un audit dans les règles de l’art pour votre projet, contactez-moi, nous trouverons certainement un moyen de nous entendre.

Données relatives au domaine

  • Nom du domaine : vérifier si le nom est un EMD (Exact Match Domain), qui en fonction du linking et des mots clés (sur)utilisés peut être bénéfique ou nocif.
  • L’âge : en théorie, plus un domaine est vieux, plus il a de background, plus il est trusté.
  • Whois anonyme ou pas : pas sur que cet élément soit pris en compte par les moteurs, mais on peut supposer qu’un Whois anonyme soit pondéré négativement si d’autres éléments « spammy » sont décelés « on » et « off-site ».
  • Pénalités : bien se renseigner au préalable si le site a subit des pénalités, parfois déclarées dans Google Webaster Tools (spam, liens artificiels etc), et si des demandes de réexamens ont été effectuées. Ce point peut être déterminant.

Données relatives à l’hébergement / serveur

  • Type d’hébergement mutualisé ou dédié : un serveur dédié offrira toujours plus de stabilité et de souplesse technique.
  • Liste des domaines hébergés sur la même IP : pour vérifier entre autre qu’il n’y ait pas un site « parasite » qui plomberait le site à auditer. Des outils en ligne comme ewhois, Spyonweb ou encore Yougetsignal font ça très bien.
  • Temps de latence, rapidité globale : l’accessibilité et le temps de réponse sont des éléments pris en compte par Google pour l’évaluation d’un site. Pour le visiteur, c’est de toute façons plus agréable de surfer sur un site réactif. GTmetrix (EN) vous donnera une bonne estimation de la rapidité de votre site (et votre serveur), à utiliser en complément de l’outil Google PageSpeed.
  • IP et géolocalisation : ici pas d’ambiguïté, si votre IP est canadienne, vous aurez peut-être du mal à vous positionner sur les résultats français, indépendamment de la langue.

Données relatives aux pages

  • URL canonique : pour les sites dynamiques, l’utilisation de ces dernières est vivement recommandée pour désigner la véritable url des pages, et éviter que certains paramètres d’url ne génèrent bêtement des duplications de contenu.
  • Crawlable ou pas : forcément si les robots d’indexation ne peuvent pas accéder à vos pages…
  • Réponse HTTP (200, 301, 404…) : pour dresser le taux de pages en redirection, et renvoyant une erreur.
  • Contenu et longueur de la balise title : élément très sensible dans le référencement d’une page, le choix et la densité des mots clés dans le titre des pages est primordial. Sa longueur varie en fonction des écoles : 70 caractère maxi, 13 mots maxi… On suppose même que Google tronque le titre de la page sur une mesure en pixel.
  • Meta description / keywords : si ces balises ont pratiquement été abandonnées par les moteurs dans leurs algorithmes de ranking, la meta description reste sensible sur 2 points : elle est reprise dans les résultats de recherche pour afficher un résumé de la page, et peut laisser croire à une duplication de contenu si plusieurs pages du site ont la même description.
  • Pagerank : toujours intéressant quoi qu’on en dise, le page rank est un indice de popularité comme les autres, et loin d’être mort.
  • Densité des mots clés : une trop forte densité, surtout sur des occurrences concurrentielles peut être vite nocive.
  • Encodage : détail principalement technique, mais certains sites mal maitrisés souffrent d’un mauvais choix de jeu de caractères, et l’on trouve des petits pâtés un peu partout. Préférez l’UTF-8.
  • Nombre total de liens : une page ne sera jamais vue (par Google) de la même manière si elle possède 150 liens ou 10.
  • Nombre total de liens externes : même principe que le nombre total de liens ci-dessus. Par ailleurs, on a tendance à dire qu’un site n’ayant pratiquement aucun liens externes peut éveiller certaines suspicions chez le chatouilleux Google.
  • Présence de liens en flash, et non compréhensibles par les robots
  • Liens cassés : cela génère des erreurs 404 et fait un peu négligé. Vous pouvez les lister avec Google Webmaster Tools si vous ne possédez pas d’autres outils. Autrement, il y a toujours l’incontournable et rustique Xenu link, totalement gratuit.
  • Liens en nofollow/dofollow : l’attribut nofollow alias « la capote du web » est parfois mal maîtrisé par les webmasters. Parfois sous-exploité pour limiter le spam, parfois utilisé avec zèle comme avec le PageRank sculpting.
  • Erreurs HTML W3C : des erreurs dans le code ne sont jamais bonnes, même si les navigateurs encaissent bien, ce n’est pas le cas de tous.
  • Présence d’éléments cachés via CSS : souvent oubliés lors des audits, ces détails ne doivent pas être négligés. Cacher un élément avec les feuilles de style n’est pas sanctionné, mais cela dépend à quelle fin.
  • Taille de la page : une page trop lourde > 100ko est parfois synonyme de lenteur.
  • Temps de chargement des scripts : certains JavaScripts peuvent plomber le chargement d’une page. Un tout petit bouton « like » non asynchrone peut ralentir considérablement l’affichage.
  • Date de création et d’indexation : l’évolution du contenu et la fréquence des MAJ dans le temps est importante.

Autres données techniques relatives au site

  • Présence d’autres noms de domaine dupliquant le site : les sociétés déposent souvent plusieurs noms de domaines, en varient les TLD pour protéger leurs marques. Plutôt que de parquer ou rediriger ces noms de domaines périphériques, certains commettent l’erreur d’en faire des domaines miroirs, générant inévitablement du contenu dupliqué.
  • robots.txt, sitemap : une mauvaise configuration de ces derniers peut isoler complètement des pages voir l’ensemble d’un site.
  • Réécriture d’URL : autrefois primordiale pour une bonne indexation des sites dynamiques (en php, asp, etc), la réécriture d’URL (ou URL rewriting) reste d’actualité pour générer des adresses plus propres et simples à retenir.
  • Utilisation d’un identifiant de session dans les URLs : l’utilisation d’SID dans les URLs est un barrage pour l’indexation.
  • Présence d’accents et caractères spéciaux dans les URLs : s’il est désormais possible d’inclure des accents dans les noms de domaines et les URLs, ce n’est pas toujours le cas des gestionnaires de contenu (CMS) générant un nombre considérable d’erreurs 404, mauvais « canonical » et autres effets néfastes pour le référencement naturel.
  • Analyse du fichier .htaccess et des directives Apache : point très sensible de la configuration d’un site web, une mauvaise configuration de ces derniers peut s’avérer catastrophique pour le bon référencement d’un site.
  • Présence dans Google Webmaster Tools, et analyse si besoin : GWT révèle parfois des problèmes que l’on ne soupçonne pas lors de l’audit, comme les messages envoyés par Google pour des notifications de spam par exemple.
  • Présence de Google analytics, ou autre programme de statistiques de trafic : ce n’est pas un scoop, l’analyse du trafic organique est nécessaire.
  • Présence de contenu dupliqué off-site : le web est régulièrement pillé, et comme Google n’arrive toujours pas à discerner un contenu original d’une copie, il faut faire la chasse au contenu « scrappé » et repompé. Pour la détection du DC, Google ou des services comme Copyscape vous aideront. Pour obtenir la désindexation rapide des contenus dupliqués, le signalement via GWT DMCA est très efficace. Tenter d’entrer en contact avec les webmasters est rarement productif.
  • Présence de techniques d’obfuscation, cloaking, éléments cachés via CSS : ces techniques dites « black hat » si elles sont mal maîtrisées peuvent entraîner de lourdes sanctions.
  • Unicité du code HTML et du webdesign : voir mon billet sur le duplicate container (duplication du code source). Si un contenant ou un thème unique n’a pas forcément d’impact direct sur le référencement, l’expérience utilisateur ne peut-être que meilleure si le contenant est travaillé (à la pogne) au service du contenu. Encore faut-il maîtriser cette partie.
  • Présence de paginations dans les pages de rubriques ou certains articles : la pagination est souvent nécessaire, mais reste une plaie pour le référencement. Il n’y a pas de solution miracle, si ce n’est l’usage des balises rel next et prev, canonical, ou de limiter au maximum les paginations. Voir également mon dossier complet sur la pagination.
  • Plan du site : un plan du site a-t-il été mis en place ? Une version XML a-t-elle été générée et soumise à Google ?
  • Répartition des publicités : mieux vaut éviter de trop charger vos pages en publicité, surtout au dessus de la ligne de flottaison. C’est ce que Google préconise, tout en faisant exactement le contraire avec ses pages de résultats de recherche.
  • Identification du CMS : on a souvent recourt aux CMS pour gérer son contenu. Certains sont plus ou moins « SEO friendly » à la base. L’attention se portera particulièrement sur les plugins parfois truffés de backdoors et codes malicieux obfusqués, très nocifs pour le SEO. Pour decrypter un code PHP obfusqué, vous pouvez utiliser cet outil (une perle).
  • Analyse du crawl du Googlebot : je vous l’accorde, on analyse rarement les fichiers logs des serveurs web. Pourtant ces fichiers sont extrêmement riches en informations, en particulier sur l’activité du Googlebot. Une bonne analyse sur un segment d’au moins 2 mois peut révéler l’intérêt que porte Google sur chaque page d’un site. Ceux qui veulent approfondir le sujet, peuvent lire mon billet sur l’exploration visuelle et dynamique du crawl du Googlebot avec Gephi.

En plus de la collecte automatisée, il est indispensable de parcourir le site avec son navigateur, armé si possible de plugins comme « web devloper » parfois très utile pour afficher des éléments cachés, désactiver les javascripts, CSS etc. Il faut également prendre le temps d’afficher le code source de quelques pages pour apprécier la qualité du code, et la présence de balises inutiles voir néfastes.

L’analyse sémantique et le contenu

balisageLa structure d’un site, son contenu, son organisation, les thèmes abordés, les passerelles entre les pages et le choix des mots sont des éléments fondamentaux pour la réussite d’un projet web.

Difficile de dresser une checklist exhaustive comme pour les facteurs techniques. Néanmoins, l’audit sémantique peut être vu sur deux plans :

  1. Le positionnement marketing et l’analyse des mots clés principaux (concurrence et faisabilité).
  2. L’analyse du contenu on-page.

Il peut arriver que les choix de positionnement sur certains mots clés soient mauvais, ou que le client n’ait pas pris le recul suffisant (à défaut d’outils adéquats) pour considérer d’autres occurrences plus compétitives. Cela demande parfois un travail d’évangélisation de la part du référenceur qui se retrouve à bousculer le modèle économique du client.
Il m’est aussi arrivé d’avoir des clients voulant se positionner sur des occurrences bien précises, sans avoir conscience qu’il fallait au préalable aborder le sujet sur leur site… Certes il y a toujours Adwords, mais l’approche du référencement n’est plus la même.

Le but est d’extraire une grappe de mots clés d’un site après analyse du champ lexicale, pour déterminer les occurrences à travailler et/ou trouver d’autres expressions compétitives ou co-occurrences. Ce travail doit être recoupé avec l’analyse des mots clés qui ont amené les visiteurs sur le site.

Une fois les principales occurrences isolées et répertoriées, il faut faire un état des lieux du positionnement dans les principaux moteurs de recherche sous forme de classement. Pour ce faire les outils sont nombreux, du gratuit comme Positeo à d’autres plus complexes comme Seo SpyGlass qui permet également un suivi de positions dans le temps.
Mais il existe des outils encore plus puissants pour auditer le positionnement d’un site sur ses mots clés fétiches : SEMRush. Pour chaque mot clés, vous aurez l’historique de l’évolution du positionnement, le volume de recherche, sa compétitivité, et ses co-occurrences. D’autres outils fort intéressants comme Market Samurai permettent également ce genre de choses.

Si vous ne voulez pas dépenser trop en outils d’analyse, vous pouvez utiliser le service Adwords de Google qui permet de mesurer la compétitivité des mots clés et de dénicher d’autres marchés et occurrences.

Le contenu doit également faire l’objet d’une inspection minutieuse

Sans contenu, impossible de positionner un site. Avec du contenu médiocre, il est possible de plomber un site.

content is kingIl est donc impératif d’apprécier la valeur du contenu en particulier des textes. Ok, ça reste très subjectif tout ça, et on nous rabâche souvent que les robots des moteurs ne comprennent pas ce qu’ils lisent. C’est une vision un peu trop simpliste : vos visiteurs eux comprennent, et en fonction de la pertinence et la qualité du contenu que vous leur proposez, leur comportement peut varier, et ça, les moteurs (enfin Google) le prennent en compte. De même qu’un contenu paraphrasé ou trop proche d’un article existant peut être détecté. Si il y a trop d’articles « maigres » et paraphrasés dans un site, et qu’il n’y a pas d’élément fort à côté pour justifier d’une certaine notoriété, la sanction du filtre « Google panda » n’est pas très loin, et pour s’en sortir, les efforts à fournir sont parfois insurmontables au regard de l’investissement en temps et bien entendu en argent.
N’oublions pas également les « Quality Raters », personnes employés plus ou moins directement par Google pour évaluer le contenu et la légitimité des sites qui auraient échappés au radar.
Ne perdons pas de vue que « contenu » signifie également outils en ligne, services, vidéos, formulaires, illustrations etc.

Structure du maillage interne : pour valoriser votre contenu aux « yeux » des moteurs, optimiser le flux de vos visiteurs et la distribution du « link juice », une solide stratégie de linking interne est de rigueur. Dans un monde idéal, la stratégie de linking interne s’établit en amont du projet, au moment de déterminer l’audience. J’explique en détail les différentes stratégies de maillages, qui quand elles sont bien menées, donnent des résultats très performants.

Voici quelques pistes pour analyser un contenu, sous l’angle SEO bien entendu :

  • Repérer les pages stratégiques, parfois appelées pages cibles ou encore landing pages pour les sites e-commerce. Ces pages serviront de référence pour les autres critères ci-dessous. Théoriquement, une page cible se distingue au nombre de liens qui pointent vers elle.
  • Analyse du champs lexicale et densité des mots clés : permet de faire ressortir les expressions visées, et d’évaluer si la densité est trop importante sur certaines occurrences.
  • Lecture… : he oui, pas d’automatisation possible ici ! Prendre quelques pages stratégiques et lire le contenu, apprécier sa qualité, l’orthographe et sa pertinence.
  • Utilisation de co-occurrences : on suppose à juste titre que Google arrive à faire une analyse sémantique des pages. Parlez lui cuisine, et il vous proposera des recettes… bref, utiliser des termes périphériques aux mots clés principaux renforce la crédibilité du contenu, et diminue l’aspect « spammy ».
  • Vérification du bon usage des balises sémantiques HTML d’entête : ici, la sémantique s’applique également aux code html. Une seule balise H1, suivie de balise H2, H3 etc, en évitant de bourriner sur les mots clés. Sur ce point la plaie réside dans l’utilisation des éditeurs HTML genre Tiny MCE conjugué à une mauvaise connaissance du référencement. L’effet est parfois catastrophique.
  • Choix des titres de page (balises title) : en référencement, si tout est extrêmement pondéré pour éviter les abus, il reste un élément déterminant on-page, plus puissant que n’importe quel autre : la balise title.
  • Répétition trop fréquente de certains mots clés dans les ancres : ce qui est valable pour le linking externe (backlinks), l’est également pour les liens internes. Mettre trop le focus sur des occurrences concurrentielles traduit inévitablement une volonté de se positionner artificiellement. Le pingouin veille…
  • Taille des articles : personne n’impose une longueur minimum pour les articles, il faut toutefois éviter d’avoir des articles trop courts (surtout sur les pages phares), de même que des articles trop calibrés ayant tous la même longueur.
  • Unicité du contenu : les textes doivent être uniques. Attention, un texte qui paraphrase celui d’un concurrent n’est pas « unique », car il utilise un champ lexicale et sémantique très proche voir identique. Il n’est pas toujours évident de réinventer la roue, surtout sur des pages de fiches produits. Aborder le sujet sur un angle différent et original permet de se différencier de la masse.
  • Utilisation de templates (textes à trous) : cette technique qui vise à utiliser un « moule » pour rédiger plus rapidement des articles, est à bannir sur des sites qui monétisent (money sites).
  • Mise en forme : un texte bien rédigé est généralement bien mis en forme avec une utilisation judicieuse de l’italic, du gras, des paragraphes et des balises d’entête. On veillera également à ce que les textes soient bien aérés pour un confort de lecture optimal.
  • Illustrations : l’absence d’images, de vidéos ou tout autre média peut paraître suspect… logique.
  • Liens vers d’autres articles : mettre en avant son contenu est forcement une bonne chose. Cela diminue le taux de rebond, augmente le nombre de pages vues et leur popularité.

Pour parfaire votre contenu, je vous invite à lire mon billet sur les techniques de rédaction pour éviter d’être sanctionné par Google panda, et le plan d’action nécessaire pour s’en sortir.

Analyse du linking et de toute l’activité « sociale » autour du site

Cette partie est tout aussi importante que le contenu pour la réussite d’un site et sa visibilité (naturelle) dans les moteurs de recherche. Sur ce poste, les erreurs peuvent également coûter très cher et les pièges sont très nombreux ! Un bilan de l’activité sur les réseaux sociaux (Twitter, Facebook, LinkedIn, Viadeo…) doit également être dressé. Des essais « A/B testing » ont prouvé qu’une page recevant plusieurs tweets et likes de Facebook sans aucun backlinks se positionnait mieux que la même page avec un backlink mais sans référence sociale.

Le backlink reste souverain dans le linking, et indispensable. La présence sur les réseaux sociaux devient de plus en plus favorable au référencement naturel, et s’avère même indispensable en fonction de la niche et du modèle économique du site.

Explorer les Backlinks

L’audit SEO doit bien entendu dresser la liste de tous les backlinks. Pour y parvenir, il faut de préférence de bons outils. Les meilleurs et les plus exhaustifs sont payants, mais il existe des solutions gratuites. La commande link:nomdudomaine.tld dans Google est à oublier, les résultats sont trop partiels, et difficilement exploitables. En revanche le nouvel explorateur de backlinks de Bing vous permettra de dresser une bonne liste… mais pour faire le tri et isoler les bons des mauvais, ce sera plus dur, surtout si il y en a beaucoup.

Il existe beaucoup de services de collecte de backlinks sérieux et professionnels. Pour certains, des périodes d’essai existent, voir des versions bridées et évolutives. Voici quelques références :

Services en ligne (ASP)

Suites logiciels

Tous ces outils ont un spectre beaucoup plus étendu que la simple analyse de backlinks. Il pourront également vous épauler dans votre audit « social », comme votre contenu.

Quelque soit l’outil utilisé, pour chaque backlink l’analyse doit permettre de faire ressortir :

  • les ancres
  • l’URL
  • la page de destination
  • le PageRank de la page source voir du domaine
  • le nombre de liens (dont liens externes de la page source)
  • l’adresse IP, et le pays d’hébergement
  • l’âge du domaine
  • la nature des liens (nofollow ou dofollow)

Avec cette collecte et ces informations, des statistiques seront tirées pour évaluer la part de bons backlinks (ceux provenant de domaines autoritaires, en dofollow, contextuels, et avec peu de liens externes) des médiocres (absence de PageRank, multitude de liens externes, annuaires…). Tout est bien sûr affaire de proportion.

Il conviendra également d’apprécier la proportion de liens entrants vers la home (l’absence de liens profonds n’étant jamais bon signe), tout comme le ratio nofollow/dofollow, la diversité des ancres (très important), ainsi que la variété des adresses IP.

Cette partie de l’audit entièrement automatisable ne demande presque pas d’analyse humaine. La tâche devient beaucoup plus ardue quand il faut rechercher un backlink parmi des milliers comme par exemple des liens achetés, mais cela reste extrêmement rare.

L’apport en popularité provenant des réseaux sociaux peut être mesuré conjointement avec les outils ci-dessus, ainsi que les outils de statistiques de trafic comme Google analytics. L’audit devra également révéler si l’activité sur les réseaux sociaux est naturelle ou artificielle. En effet tout s’achète, les backlinks comme les fans sur Facebook, de followers, ou encore un « pack de like »… mais pour rester sous le radar, il faut se fixer des limites.

Analyse de la concurrence dans les SERPs

C’est une étape parfois facultative dans l’audit SEO, qui vient théoriquement après l’analyse sémantique du site et le positionnement sur les mots clés principaux. Elle est utile pour évaluer le degré de compétition, découvrir ses points faibles, mettre en exergue certains leviers (économiques et SEO), et pourquoi pas la découverte de « spots » à backlinks.

Dans un premier temps, à l’aide des occurrences phares et concurrentielles visées par le site, on effectue une recherche sur les moteurs les plus connus (ça peut se résumer à un seul hein), et on regarde qui est devant. Au cas par cas et en accord avec le client, on effectuera des mini-audits de ces sites afin de voir ce qu’ils ont sous le capot.
Le « référencement local » a aussi son rôle à jouer en fonction du domaine d’activité. Une analyse de la présence sur Google maps, mais également sur les portails régionaux et institutionnels (CCI par exemple) s’impose.
Bien entendu l’analyse de la concurrence peut rallonger considérablement le temps de travail. Il est préférable de proposer ce poste en option et à la carte.

Le modèle économique est également à prendre en compte dans le référencement

Chose inconcevable avant la mise en place du filtre Panda, Google ne ménage pas ses efforts pour shooter tous ceux qui peuvent faire de l’ombre à son business. Terminé l’impartialité et la neutralité, la logique pécuniaire a finalement pris le dessus. Avec son Google shopping, son propre comparateur de prix, de billets d’avions etc, l’ogre veut s’octroyer un maximum de visibilité.
Ceux qui souffrent le plus sont les plus faibles, les sites dont le biz model repose essentiellement sur de l’affiliation, des catalogues et services externalisés. Officiellement Google prétexte que ces derniers n’ont aucune valeur ajoutée pour justifier une bonne position dans les SERPs, sauf que les services qu’il propose n’apportent rien de plus. Mais je ne vais pas m’épencher plus longtemps sur ce vaste sujet, ce n’est pas le propos de ce billet.

L’audit du site devra donc vérifier la présence de liens d’affiliation en surnombre, de catalogues XML archi dupliqués, la manière de monétiser le site. Il faut se plier à la logique du dominant, même si ses pratiques sont très contestables.

Le talon d’Achille de l’audit

Il reste toutefois un détail important très difficile à analyser : l’évolution d’un site dans le temps. La fréquence et le rythme d’acquisition des backlinks en fonction des mises à jour, les changement de CMS et d’URL, changements de référenceurs et de stratégies SEO… Autant de détails sensibles pour le référencement naturel que le prestataire ne peut pas forcément voir faute de données, de statistiques, ou de transparence. Le dialogue avec le client reste ici le seul outil fiable.
Un site irréprochable sous tous les angles, mais qui par le passé a été considéré comme SPAM pour des quality raters, a subit panda et pingouin, même complètement refait ne s’en sortira probablement pas. Commencez donc l’inspection du site par là.

Je vous invite bien entendu à interagir pour proposer d’autres critères non mentionnés ici, ou simplement donner votre vision de l’audit et pourquoi pas vos expériences.

Aurélien Berrut

Un peu de personal branding pour l'auteur (Aurélien Berrut)

J'ai deux passions : la photographie que j'aborde sur d'autres URLs, et bien entendu le SEO qui me fait vivre. Je travail dans le web depuis l'époque des start-ups et la bulle spéculative. Mon parcours passe par le webmastering, l'edition de sites, l'affiliation, le X, le web-marketing et la formation. Aujourd'hui je concentre toute mon activité sur l'aquisition de trafic et le SEO.
En savoir plus sur mes prestations >> | Suivez-moi sur Google+ et Twitter.


Vous pouvez avoir un lien en DoFollow si :
  • - Vous ne faites pas de lien optimisé (brand ok).
  • - Votre contribution apporte de l'eau au moulin et ne se contente pas de remercier (même si c'est toujours appréciable).
  • - Vous ne donnez pas l'impression de ne pas avoir lu l'article.
  • - Votre site doit graviter dans l'univers du SEO / web marketing / IT.
Le but n'étant pas d'être plus sévère, mais au contraire plus équitable et... naturel. N'oubliez-pas : moins de spamco = meilleur jus !

43 commentaires sur “L’audit SEO en détail

  1. Philippe

    Bonjour,

    Merci beaucoup pour cet excellent article, sincèrement je ne pensais pas qu’un audit pouvait comprendre autant de paramètres. Je ne travaille jamais ou très rarement sur des sites dont je ne connais pas le webmaster, je n’ai donc jamais eu l’opportunité de réaliser ce genre d’audit, uniquement mesurer la concurrence et la faisabilité d’un projet pour faire une estimation du temps de production. Mais cet article est une véritable encyclopédie pour établir un audit ultra professionnel, bravo !

  2. Sylvain (AxeNet)

    Franchement, bravo pour ce récapitulatif. Bon article, beau travail.
    Pour aller plus loin (quoi que c’est difficile vu l’exhaustivité de votre article), j’ai aussi pour habitude de donner des exemples rédactionnels concrets dans mes audits.
    Je rédige toujours intégralement quelques pages en expliquant en détail le pourquoi du comment. Ça rassure beaucoup le client qui ne reste pas dans la théorie mais voit l’application pratique des conseils donnés.

  3. Karine d'Afimes

    Je suis tombée sur ton article relayé sur le mur Google+ d’un de mes amis et je dois dire que je n’avais pas encore lu d’article aussi détaillé, avec tous les liens vers les logiciels permettant de faire le bilan de son référencement. Alors j’en profite pour te remercier et partager à mes cercles ton document. Merci.

  4. Presstor le Sentimancho

    Tres belle ressource exhaustive sur bien des aspects. Partagé sur G+.
    Bonne continuation Aurélien.

  5. Mikiweb

    Très bonne énuméraiton des différentzs points d’un audit seo.
    Je pense que l’audit est la partie la plus difficile et la plus technique du référenceur.
    En effet il faut avoir :
    - une bonne culutre générale du web de ces pratiques…
    - de bonne connaissance technique et sémantique et pas seulement d’un point de vue seo. Le fait d’avoir déjà réalisé des sites web aident énormement ;)
    - un bon esprit d’analyse : les graphiques et tableaux c’est bien mais le but d’un audit est quand même de mettre en avant les erreurs du site et les recommandation pour les réparer

    C’est la base pour bien cibler les actions seo et avori un retour sur investissement maximum.

    Je complèterai ta description de l’audit par un article du site seomoz sur l’audit seo qui pousse un peu plus loin la réflexion sur le sujet : http://www.seomoz.org/blog/how-to-perform-the-worlds-greatest-seo-audit

  6. Webconsulting

    Pour le référenceur l’audit SEO est une étape indispensable. En général je propose un audit SEO exhaustif, ensuite le client peut négocier sur le type d’audit SEO qu’il veut (technique, sémantique, concurrence, netlinking).

  7. KingRush

    Un récapitulatif super complet bravo, petite question subsidiaire, tu estimes à combien le prix d’un tel audit sur un site de taille moyenne?

  8. Aurélien

    Très bel article, merci pour le partage.
    L’approche est pro et montre bien qu’il y a du travail.

    Cela diffère avec les quelques « audits publics » parfois publiés qui sont très incomplets.

  9. Le Juge

    Pfiouuuuuuuu C’est beau … tres tres bon cet article – devrait etre retweeté et partagé de partout – ca nous eviterai de voir des clients nous ressortir leurs vieux audits moisis avec un oeil plein de larmes en nous disant - »non je veux pas de SEO j’en ai deja fait et ca m’a rapporté qu’une perte seche de $1000″

    Bref bel article – tiens pour revenir sur le sujet du préaudit – j’ai un vieil article sur le muscle ou je comparais un de mes audits de Prévente justement a un audit tout pourri et super cher – http://lemusclereferencement.com/2010/10/25/putain-ce-vendeur-ma-litteralement-fait-lamour-comme-un-dieu/

  10. RAISE UP Consulting

    Un article de référence, difficile d’être plus complet sur le sujet…!!

    J’ajouterais aux remarques de Michael le Folch que des bonnes connaissances en marketing sont aussi un vrai plus pour réaliser un audit pertinent du site cible et de la concurrence. Faire un petit audit Marketing, conjointement à un audit SEO, permet d’analyser plus en profondeur quels sont les freins et les leviers sur lesquels on peut jouer et cela aide à mieux définir quels ajustements sont nécessaires pour mettre en place une stratégie SEO efficace.

  11. Aurélien Berrut Auteur

    Ca dépasse peut-être un peu le cadre de l’audit, mais tu as complètement raison, une démonstration par l’exemple est souvent productive pour sensibiliser le client.

  12. Aurélien Berrut Auteur

    J’ai lu ton article… on sent bien que tu l’as écrit avec un petit peu d’amertume envers quelques confrères. C’est exactement la même chose pour moi, mais je préfère ne pas « montrer du doigt », les choses finiront par se faire naturellement j’espère.

  13. agence web joomla

    Merci pour cet excellent article, qui redonne ces lettres de noblesses au métier de référenceur, ô combien difficile !

  14. Restaurant à Troyes

    Aussi complet que mes céréales du matin !!! Je vais de ce pas l’imprimer et l’accrocher en face de mon bureau pour toujours avoir une bonne piqûre de rappel pour mes audits!!!!! Merci pour ce travail de titan.

  15. loran

    Alors là, c’est un très bel article qui servira même aux professionnels !
    La question est donc : quelles sont les tâches à sélectionner en fonction du budget alloué. Car c’est une liste exhaustive pour faire un audit SEO…

    Dans un petit budget, je doute d’aller profondément dans le détail. Je ne sélectionnerais que l’essentiel. Quant à un gros budget, on y va gaiement :)

    A bookmarker & partager.
    Au moins pour avoir ça de côté.

  16. Clement

    Tout d’abord merci pour ton article super complet et très intéréssant !
    J’ai une question concernant la partie « contenu » : comment en avoir de la quantité et de la qualité sur un site e-commerce ? (Son but n’étant pas forcément d’avoir de beauc et grands articles)
    Comment expliquer le superbe référencement de archiduchesse.com alors qu’il n’y a pas forcément beaucoup de contenu ?

  17. Arnaud Lemasson

    Félicitation pour ce billet complet ! C’est du propre, rien à dire, rien à ajouter. Il est vrai qu’on ira pas aussi loin pour les petits clients, mais on pourra au moins piocher selon les besoins réels de chaque audit.

  18. Aurélien Berrut Auteur

    Comme je le dis dans mon billet, « bon contenu » ne rime pas forcément avec texte longs et qualitatif. La qualité du et des services proposés compte, les produits mis en ligne, l’ergonomie….

  19. Hip Hop Francais

    Super article, détaillé et complet, que demander de mieux ! Cela devrait servir à tous les professionnels et même aux clients pour qu’ils sachent exactement ce que demander en fonction du budget qu’ils ont. Je partage !

  20. Le Juge

    Arf – oui a l’époque de cet article il y avait des tensions va on dire dans la communauté sur le fait de bacher « chht chht pas de marque » en publique ou non – mais c’est e passé tout cela…

  21. Paysagiste dplg

    Félicitation pour cet article, une véritable bible. Avec toutes ces informations il y a de quoi réaliser un audit SEO digne de ce nom !

  22. Marie-Aude

    Bravo pour cet article très détaillé… qui correspond à peu près à ce que je propose, à un détail près : je pense que l’analyse de la concurrence n’est pas optionnelle. Je suis tout à fait d’accord avec vous, sur le fait que cela alourdit fortement l’addition, mais cela me semble indispensable pour arrivr à déterminer une stratégie de référencement et un plan d’action (qui est quand même l’objectif de l’audit)

    C’est souvent très riche d’enseignement sur les sources de BL potentielles, mais aussi sur les mots clés. Particulièrement dans le B2C, les clients n’ont pas toujours une bonne idée des mots clés réellement saisis, et l’analyse de la concurrence donne un autre angle que les outils comme Adwords ou Semrush. En gros, si un bon concurrent travaille visiblement un mot clé, il y a du trafic à gagner.

  23. jeux de sport

    Bonjour,
    Difficile de faire plus complet que cette liste vraiment très exhaustive. Moi il y a la moitié des actions que je n’aurais jamais pensé à faire, donc ça va me servir grandement pour la suite, notamment en utilisant certains des outils listés, et me permettra je l’espère de m’améliorer. Merci pour cette bonne leçon.

  24. IDE Conseil

    Excellente synthèse exhaustive de l’audit SEO, je suis un peu en retard de lecture…mais je le tweet de ce pas !
    J’ajouterai cependant un point d’analyse, à la limite du champ du pur référenceur bien sûr mais l’éthique nous l’impose : c’est l’audit juridique du site tant sémantique (ce site respecte-t-il la législation en vigueur dans son secteur d’activité, son pays, …) que concurrentiel (respect du droit des marques par ex) ou purement législatif (déclaration CNIL per ex, …).
    Le DMCA de Google est la protection américaine du droit d’auteur, en France c’est la CNIL : http://www.cnil.fr/ et chaque pays a la sienne à voir ici : http://bit.ly/RxnzNH.

  25. Le grain de sel de Laura

    Wahoo,
    Super description détaillée de l’audit seo !
    Il ne manque plus que les fiches détaillées sur le zoo de google, notamment les pandas et les pingouins. Et comment dresser ce bestiaire.

  26. Vince

    Article très instructif, cependant je me pose une question quand à l’audit de la concurrence : on entendait il y a peu au VLC2012 parler de scrap en « sous-marin ».
    Y a t-il un risque juridique concernant cette phase de l’audit au cas ou le VPN et les proxies pètent par exemple?

  27. Le grain de sel de Laura

    Et est-ce qu’il y a aussi une page sur pingouin ?
    Je n’ai pas trouvé avec la fonction recherche du blog.

  28. Aurélien Berrut Auteur

    Pourquoi pas ? Cela dépend du client, de la confiance, du type de contrat, des closes de confidentialité… Pourquoi le client devrait-il être réticent à donner accès à des services essentiels pour le SEO ?

  29. HeyWatch

    Hop je l’avais loupé celui-ci d’article :) Heureusement que @YakaMama m’a fait un update :)
    Super bonne base de travail pour préparer un audit sérieux. J’aime bien la trame que tu utilises car elle est relativement simple et donc facilement explicable à un client. Et on sait que faire comprendre le SEO à un client, ça peut relever de l’exploit… :P

    Merci encore !

  30. Christophe Maggi

    Voici enfin une très bonne analyse des bonnes pratiques d’audits. Je rejoins ce qui a été dit dans les commentaires. Donner des exemples ou expliquer en « français » pourquoi telle ou telle point pose problème est souvent très bien vu par le client. Il a au moins l’impression de comprendre. Personnellement, je donne à chaque étape des conclusions maisons et une conclusions générale en fin d’audit. Pour compléter cet article, il ne manque qu’un panel des tarifs pratiqués (pour avoir une idée) et une autre question que je me pose est Quel pourcentage d’audit convertissez vous en mission de référencement ?

    Good Job.

  31. respiland

    Merci pour cet excellent article très complet comme tous les autres d’ailleurs.
    Je me permet juste de vous proposer un vieil outil que j’utilise systématiquement pour mes audits et qui permet de voir toutes les éventuelles tromperie sur une page en ayant le même visu de la page que le bot c’est le navigateur Lynx-viewer qui est uniquement en mode texte.
    A télécharger ici ftp://lynx.isc.org/lynx2.8.7/ ce viewer est en natif dans les distrib linux.
    Merci et à bientôt

  32. HSD

    Merci Aurélien quant à cet article détaillé, m’éclairant ainsi sur certains points stratégiques d’un audit.
    Je suis actuellement en train de bosser sur le linking interne d’un site E-commerce Anglais établi depuis quelques années (oui, je travaille en Angleterre :-) ) et je dois dire que ce n’est pas de la tarte…
    Je recommende vivement l’article d’Aurélien à ce sujet (http://www.htitipi.com/blog/linking-interne.html), le meilleur article que j’ai pu lire à ce jour…
    D’ailleurs, Aurélien, je sais que que tu es très occupé, mais que pourrais-tu me conseiller au premier abord quant à ma stratégie de maillage interne? Silo , arbre généalogique ?? Le site en question: http://www.hygienesuppliesdirect.com/
    Une aide très appréciée!!

    Merci d’avance et encore bravo pour ce post !!

  33. Aurélien Berrut Auteur

    @HSD : Merci beaucoup pour ton commentaire fort appréciable. Je peux t’aider pour ton site, mais le conseil c’est ce qui me fait vivre… et j’en donne déjà beaucoup gratuitement sur ce blog ;-)

  34. Alliance SEO

    C’est vraiment une très bonne énumération des points d’un audit seo. Je pense qu’on est pas loin d’avoir fait le tour de tout les points. On a vraiment ici quasiment tout ce qu’il faudrait dans un audit professionnel, partie que je trouve vraiment la plus technique et la plus longue pour un référenceur. Mais cela permet bien souvent de savoir ce qu’on a, ou on va, et avec quels moyens.

  35. Aurélien Debord

    Pour suivre votre blog depuis quelques temps, j’avoue être toujours impressionné par la qualité de vos articles. Je suis tombé sur celui-ci un peu ancien déjà mais toujours d’actualité.

    A l’instar de Sylvain d’Axe-Net, j’ajoute à mes audits des exemples concrets afin de guider la mise en oeuvre des préconisations. Cela rend les choses généralement plus claires.

    Au plaisir de vous lire.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>