Générer votre sitemap.xml

Générer votre sitemap.xml

Je voulais vous présenter aujourd’hui encore un outil fait main et à placer sous la catégorie « SEO » de votre projet. Autrement dit, un outil pour votre référencement. Si vous vous y intéressez un peu, vous apprendrez très vite que votre site web doit s’accompagner d’un fichier nommé « sitemap.xml« . Mon outil peut vous aider pour générer votre sitemap.xml.

sitemap.xml ?

Son nom est en fait « sitemap« , et son extension est le « xml« . Un langage très répandu sur la toile (et dont j’en ai déjà fait part à travers ce blog ici). C’est une convention, et je vous conseille fortement de la suivre. La plupart du temps, ce fichier se situe à la racine de votre site. Si vous tournez sous un CMS comme WordPress, vous aurez probablement sous le capot, une extension SEO qui vous le créera à votre place. Et il existe également des générateurs de fichier sitemap.xml sur le web. Comme par exemple https://www.xml-sitemaps.com/.

Que fait-il ?

Il cartographie en quelque sorte tous les liens internes de votre site web. En allant plus loin, on peut également définir le langage de la page référencée ainsi que son ordre d’importance (de mise en avant, soit sa priorité). Ce fichier est ensuite lu par les moteurs de recherches et les aide ainsi à référencer votre site en indexant vos pages. Ce qui est quand même utile si vous voulez toutefois que vos pages soient consultées !

Et ton outil fait main alors ?

En essayant un de ces outils, je me suis rendu compte qu’il n’avait pas inséré toutes les pages, et ce pour une raison que j’ignore. Je me suis alors mis en projet de tenter de générer moi-même un fichier xml, toujours dans l’idée de créer des outils web utile pour la mise en place d’un site. Voilà le résultat :

Le code en détail

À la ligne 5, vous trouverez comment je reset la zone de texte, ce qui est toujours pratique … ( )

À la ligne 11, une petite fonction très utile qui me permet d’afficher la date de modification de la page.
Cette fonction formate la date courante au format de la date conventionnel de la balise <lastmod>.
Comme on est sur un générateur, chaque page aura la même valeur à ce stade.

C’est à la ligne 45 que tout se joue ; en fait je joue avec les retour à la ligne et les « retours chariots« .
Donc si vous insérez les liens de vos pages à la ligne, vous aurez normalement un xml tout fait et prêt à être copier dans votre fichier xml à mettre en ligne. Le texte généré se retouve dans la zone de texte, donc vous n’avez plus qu’à en copier le contenu. Que se passe-t-il exactement ? Je remplace chaque retour à la ligne par des balises avant et après les urls que doivent d’ailleurs se retrouver dans la fichier final.

Améliorations possibles pour générer votre sitemap.xml

Comme dit précédemment, on pourrait imaginer pousser l’outil un cran plus loin en allant ajoutant une priorité aux pages. C’est d’ailleurs recommandé. J’ai pensé à réaliser une priorité commune comme pour les dates, mais ce n’est sûrement pas recommandé non plus. Il faudrait étudier la question et améliorer ce point.

En attendant, je l’ajoute aux outils de lintermediaire.be, dans la partie SEO.
Vous irez sans doute plus vite si vous n’avez pas sous la main la liste des liens qui composent votre projet en utilisant un outil en ligne comme proposé en début d’article. Mais vérifiez bien si l’ensemble de ces derniers sont présents. L’outil ici part du principe que vous êtes en possesion des liens de votre site et vous générera un sitemap.xml classique et aux répondant aux normes de bases.
Si vous en avez besoin à votre tour, n’hésitez pas !

Newsletter