La ré-écriture d'URL avec E-Majine
Qu'est-ce ?
Cela consiste à remplacer une chaine de caractères utilisée par les serveurs
web par une autre.
Concrètement, il s'agit des caractères affichés après le nom de domaine du
site, dans la barre d'adresse de votre navigateur internet.
Exemple :
http://www.monsite.com/marequete.php?param1=moncritere¶m2=autrecritere&variable=français
pourra être avantageusement remplacé par :
http://www.monsite.com/formation/referencement/optimisation-de-code-source.php
Pourquoi recourir à la réécriture d'URL ?
- D'un point de vue purement pratique, cela permet d'afficher l'arborescence
que l'on souhaite voir apparaitre dans la barre d'adresse.
- C'est également beaucoup plus explicite pour l'internaute (qui n'a plus
besoin de nommer ses favoris/bookmarks puisque le contenu est dans l'URL).
- Pour le référencement internet, les robots des moteurs de recherche
collectent les adresses des pages web (URL) et y associent des champs lexicaux
: Une URL de type
http://www.e-majine.com/gerer-son-site-avec-e-majine-manage/, et qui
comprend dans le contenu visible de la page des mots liés à la gestion de site,
va être mieux prise en compte par le moteur de recherche, puisque les mots-clé
associés au thème de la page sont repris dans l'adresse, qu'une URL de forme
http://www.e-majine.com/1435423.html.
A contenus équivalents et en partant d'une page "nouvelle" (pas de liens
externes pointant vers elle), le moteur affichera en priorité notre URL dans
les résultats !
Enfin,
http://www.monsite.com/marequete.php?param1=moncritere¶m2=autrecritere&variable=français
regroupe les inconvénients suivants : illisibilité, signification nulle pour
l'internaute non spécialiste, caractères spéciaux (?/&/$/€,ç..) encodés et
non pris en compte par la plupart des moteurs de recherche.
C'est une adresse qui ne sera pas retenue pour figurer dans les index des bases
d'engins de recherche en réponse à la requête "naturelle" d'un
internaute.
Accessoirement, c'est aussi potentiellement dangereux car cela fournit un bon
indicateur pour toute personne malveillante qui tenterait d'accéder par
déduction à d'autres contenus...
Je suis convaincu(e) ! Quand utiliser la réécriture d'URL ?
Lorsqu'il s'agit d'un site web dit "statique" (les pages sont assemblées à la
main, et les liens vers les ressources et les autres pages sont connus d'avance
par le webmaster), nul besoin de ré-écrire l'adresse puisque le webmestre peut
choisir lui-même le nom à donner à ses fichiers.
Lorsqu'il s'agit de sites administrables, c'est à dire dont le contenu est créé
puis publié au fur et à mesure, l'exercice est impossible puisque nul ne peut
prédire les contenus qui vont être intégrés. Il s'agit alors de trouver un
système qui va forger une adresse à partir d'éléments contenus dans et autour
de la ressource.
L'état de l'art de la ré-écriture d'URL
Par défaut, la grande majorité des sites dits "dynamiques" servent leurs pages
en laissant dans l'URL les paramètres qui sont passés via le langage interprété
côté serveur, afin d'accéder à la base de données et de retourner les résultats
correspondants à la requête de l'internaute.
Ce système est utilisé massivement par la plupart des outils dits "web 2.0",
qu'ils soient blogs, forums ou CMS...
Concrètement, cela donne souvent, avec les différentes solutions du marché
(exemples au hasard) :
- article.php3?id_article=765
- spip.php?article98
- /content/section/1/2/
- index.php?id=250
- /content/#more-55
Note : Certaines de ses solutions peuvent permettre la ré-écriture
d'URL, à condition d'user de plug-in (greffons), et d'aller configurer et
éditer manuellement des fichiers .php et .htaccess , et sous réserve de
compatibilités entre versions; enfin sous réserve de compatibilité avec la
configuration serveur de l'hébergeur...
E-Majine les surpasse en déclinant ce principe au plus petit élément
rédactionnel publié sur le site, l'article.
En effet, par défaut (sans aucune configuration), E-Majine est optimisé pour le
référencement naturel avec un système d'écriture d'URL qui reprend le chemin de
votre arborescence (au minimum), puis le nom du fichier (si vous l'avez
spécifié).
Ex :
http://www.e-majine.com/concevoir-des-sites-internet-cms/solutions/les-produits-standards/34-gerer-son-site-internet.html
Et depuis la V1, c'est également tout le catalogue (et donc les produits...)
qui bénéficie de cette fonctionnalité !
Où est le piège ?
Il n'y en a pas ! E-Majine vous permet d'associer exclusivement une adresse
optimisée à une page. Ainsi, pas de risque de se voir pénalisé par Google pour
"duplicate content" (duplication de contenu > deux pages proposant le même
code - visible et invisible - dans le but de posséder un plus grand nombre de
pages indexées, et donc de toucher potentiellement plus d'internautes en
squattant les places dans les pages de résultats des moteurs de recherche; en
savoir plus sur le
site de Google "outils pour webmasters").
Existe-t-il des contraintes ?
Bien entendu, dans le cadre d'une réécriture d'URL pour améliorer le
positionnement de sa page dans les feuilles de résultats des moteurs de
recherche, il ne faut pas s'imaginer qu'il suffit de truffer son adresse de
mots-clés pour que l'affaire soit gagnée...
Tout comme pour les sous-domaines mieux notés que les répertoires, il faut
penser à positionner les mots importants le plus près du nom de domaine
possible (donc à gauche pour notre sens de lecture.) Ceux qui viennent après
perdent en importance. Enfin, il est souvent question de limite du nombre de
caractère d'une URL, variable tant que le serveur est capable de donner la page
(sans quoi il retourne une erreur 414 - URI trop longue).
Voici ainsi quelques adresses ayant pignon sur web :
http://thelongestlistofthelongeststuffatthelongestdomainnameatlonglast.com/wearejustdoingthistobestupidnowsincethiscangoonforeverandeverandeverbutitstilllookskindaneatinthebrowsereventhoughitsabigwasteoftimeandenergyandhasnorealpointbutwehadtodoitanyways.html
Et une requête encodée :
http://www.google.com/search?hl=en&lr=&c2coff=1&rls=GGLG%2CGGLG%3A2005-26%2CGGLG%3Aen&q=http%3A%2F%2Fwww.google.com%2Fsearch%3Fhl%3Den%26lr%3D%26c2coff%3D1%26rls%3DGGLG%252CGGLG%253A2005-26%252CGGLG%253Aen%26q%3Dhttp%253A%252F%252Fwww.google.com%252Fsearch%253Fhl%253Den%2526lr%253D%2526c2coff%253D1%2526rls%253DGGLG%25252CGGLG%25253A2005-26%25252CGGLG%25253Aen%2526q%253Dhttp%25253A%25252F%25252Fwww.google.com%25252Fsearch%25253Fsourceid%25253Dnavclient%252526ie%25253DUTF-8%252526rls%25253DGGLG%25252CGGLG%25253A2005-26%25252CGGLG%25253Aen%252526q%25253Dhttp%2525253A%2525252F%2525252Fwww%2525252Egoogle%2525252Ecom%2525252Fsearch%2525253Fsourceid%2525253Dnavclient%25252526ie%2525253DUTF%2525252D8%25252526rls%2525253DGGLG%2525252CGGLG%2525253A2005%2525252D26%2525252CGGLG%2525253Aen%25252526q%2525253Dhttp%252525253A%252525252F%252525252Fuk2%252525252Emultimap%252525252Ecom%252525252Fmap%252525252Fbrowse%252525252Ecgi%252525253Fclient%252525253Dpublic%2525252526GridE%252525253D%252525252D0%252525252E12640%2525252526GridN%252525253D51%252525252E50860%2525252526lon%252525253D%252525252D0%252525252E12640%2525252526lat%252525253D51%252525252E50860%2525252526search%252525255Fresult%252525253DLondon%25252525252CGreater%252525252520London%2525252526db%252525253Dfreegaz%2525252526cidr%252525255Fclient%252525253Dnone%2525252526lang%252525253D%2525252526place%252525253DLondon%252525252CGreater%252525252BLondon%2525252526pc%252525253D%2525252526advanced%252525253D%2525252526client%252525253Dpublic%2525252526addr2%252525253D%2525252526quicksearch%252525253DLondon%2525252526addr3%252525253D%2525252526scale%252525253D100000%2525252526addr1%252525253D%2526btnG%253DSearch%26btnG%3DSearch&btnG=Search
Et avec E-Majine ?
De la même façon que l'écriture pour le web requiert un travail adapté (on
appelle cette tâche optimisation des contenus), vous déclarez les règles que
vous souhaitez voir appliquer à cette ré-écriture en signifiant à E-Majine les
paramètres à intégrer dans l'URL.
Voici les différentes possibilités qui vous sont fournies pour faire du
sur-mesure, sans connaissance particulière :
Nom de la page : c'est la partie finale de l'URL, placée donc
à l'extrémité droite, et qui comporte l'extension du fichier. Il vous est ainsi
possible d'associer à votre page un nom et une extension de votre choix (.html,
.html, .php, .txt....)
Titre de la page : c'est la balise html
<title> dont le contenu est affiché dans la barre du
navigateur. C'est une balise primordiale dans le cadre du référencement
naturel.
Pour le
CATALOGUE E-COMMERCE, depuis la V1 d'E-Majine, il est
possible de choisir un certain nombre de paramètres des fiches produits qui
seront remontés dans l'adresse :
- Libellé
- Référence
- Propriété(s) additionnelle(s)
- Variante(s) de produits
Tout en ayant la possibilité d'inter-changer l'ordre de ces éléments dans la
réécriture.
Il en va de même pour les fiches du module annuaire. Il est ainsi possible de
choisir parmi les noms de catégories, et les noms des fiches. Par exemple :
/liens/category-3-sites-de-salles-de-concerts.html
L'accès à la fiche de l'annuaire permet de remonter le titre de l'entrée dans
le
<title> de la page.
Utilisée conjointement avec la ré-écriture d'URL de l'arborescence dans
E-Majine, vous allez ainsi obtenir des URL dites "propres", c'est à dire dont
la syntaxe comprend des mots explicites et signifiants, sans caractère spécial
(encodage, sigles, etc) qui pourrait en gêner la lisibilité.
Le même principe est décliné aux articles (de type actualités, évènements, en
multi-publication...)
Le forum hérite quant à lui du passage des titres et de la description au
niveau de la balise
<title> et de la balise meta
description.
La ré-écriture d'URL est également la méthode utilisée dans E-Majine pour gérer
les exceptions, comme la fameuse
page 404 ("
page not
found", page non trouvée (sur le serveur)), que vous pouvez choisir de
diriger vers une page/rubrique spéciale (un plan du site ?), ou bien de ramener
au niveau d'arborescence parent.
(A noter que les
redirections au niveau des rubriques, si
utilisées via les méthodes de publication, sont de type
"
permanentes" (entête
HTTP 301)).
Ces possibilités de ré-écrire vos adresses vous épargnent le travail délicat
qui est effectué en coulisse, basé sur des règles d'expressions régulières dont
la moindre erreur (de logique ou de syntaxe) peut entrainer l'indisponibilité
partielle ou totale de votre site !
Elles sont
accessibles simplement, et ne demandent
aucune connaissance informatique (E-majine corrige vos
suggestions en remplaçant les caractères spéciaux et les espaces.)
Enfin, elles sont
immédiates à mettre en oeuvre, et peuvent
s'appliquer de
façon individuelle à chaque page. Ainsi donc,
on peut laisser au choix E-Majine gérer la ré-écriture automatiquement, ou
attribuer arbitrairement (
à posteriori) une adresse individuelle à une
page.
Et c'est ce qui fait l'atout incomparable d'E-Majine face aux
autre solution qui ne peuvent qu'appliquer des règles de réécriture
à priori (c'est à dire où il faut définir une règle
qui sera appliquée de façon uniforme à toutes nos adresses) : dans le cadre
d'un travail collaboratif sur un site E-Majine, la personne en charge du
référencement peut venir optimiser individuellement les URL des pages et des
articles crées par les rédacteurs même une fois les contenus publiés !
Nous aborderons dans un prochain billet la question d'accessibilité, en
couvrant les notions de code standard conforme, de normes et de l'optimisation
appliquée aux ressources dans E-Majine (code XHTML et CSS valides, attributs
ALT,
LONGDESC,
LANG gérés nativement,
etc...)
YF
Billet original sur Yann Faurie