Hello les amis.
Je réponds à l’appel de pas mal de référenceurs (euh, deux en fait) qui cherchent à savoir s’il est possible de savoir, dans une liste d’URL définie quelles sont les pages qui comportent un attribut canonical, et évidemment, la destination de cette URL canonical.
Bien entendu, la solution que je vais vous délivrer est appelé »solution du pauvre » car elle se base sur une liste d’URL déjà connu. Il est plus simple d’utiliser Screaming Frog SEO pour obtenir ce résultat et le laisser s’occuper de crawler tous vos liens.
Maintenant que le problème est posé, voyons voir ce qu’il faut faire manuellement :
- Prendre une liste d’URL (dans un plan de site ou avec Xenu par exemple)
- Créer un tableau à deux colonnes : une comportant les URLs, l’autre disant si oui, ou non, il y a un canonical associée
- Ouvrir les pages, faire une recherche et coller le résultat dans le tableau.
Bon pas très sexy comme programme, sachant en plus qu’il faut gérer ça pour 500 URLs (bah oui les radins, à moins de 500 Screaming Frog marche).
Donc on va automatiser tout ça avec une petite macro que voici :
VERSION BUILD=7021019 RECORDER=FX
SET !EXTRACT_TEST_POPUP NO
SET !ERRORIGNORE YES
SET !DATASOURCE plansite.csv
SET !DATASOURCE_COLUMNS 1
SET !TIMEOUT_STEP 1
TAB T=1
SET !DATASOURCE_LINE {{!LOOP}}
URL GOTO={{!COL1}}
ADD !EXTRACT {{!URLCURRENT}}
TAG POS=1 TYPE=LINK ATTR=rel:canonical EXTRACT=HREF
SAVEAS TYPE=EXTRACT FOLDER=* FILE=canonical.csv
Avant de mettre en route cette macro, il vous faudra créer la lite d’URL avec une URL par ligne sur une colonne dans un fichier csv que vous enregistrerez dans le dossier Datasource.
Cette macro est idéale pour les débutants car elle permet d’aborder deux notions d’Imacros : l’automatisation et l’extraction de données. Ligne par ligne ça donne :
- Version de l’enregistreur (sert à rien)
- Ne pas mettre de popup à l’extraction (à désactiver pour les tests)
- Ignorer les erreurs
- Chemin où aller chercher les URLs
- Nombre de colonne à traiter dans le fichier csv
- Ne pas passer plus d’une seconde par erreur (accélère la macro)
- Appeller le premier onglet actif
- Prévenir que la ligne correspond au numéro de la boucle
- Aller à l’url désigné par la ligne précédente
- Extraire l’URL (facultatif mais va vous faciliter la vie après)
- Extraire le canonical
- Sauver dans un fichier canonical.csv
Il ne vous reste plus qu’à lancer la macro en boucle en la répétant autant de fois que vous avez de lignes et de prendre un café.
Vous obtiendrez ensuite un fichier CSV excel avec deux colonnes : l’URL et une canonical s’il y en a. Après traitement et filtre, vous pourrez garder uniquement ce qui vous intéresse !
N’hésitez pas à me faire un retour si besoin. Et si cet article vous a plus vous pouvez me soutenir en faisant un lien vers mon Pandanarol

