Le blog de Medialibs

Aller au contenu | Aller au menu | Aller à la recherche

Mot clé - référencement

Fil des billets - Fil des commentaires

mardi, avril 15 2008

La réécriture d'URL (URL rewriting) avec E-Majine

La ré-écriture d'URL avec E-Majine


Qu'est-ce ?


Cela consiste à remplacer une chaine de caractères utilisée par les serveurs web par une autre.
Concrètement, il s'agit des caractères affichés après le nom de domaine du site, dans la barre d'adresse de votre navigateur internet.

Exemple :

http://www.monsite.com/marequete.php?param1=moncritere&param2=autrecritere&variable=français

pourra être avantageusement remplacé par :

http://www.monsite.com/formation/referencement/optimisation-de-code-source.php

Pourquoi recourir à la réécriture d'URL ?


  • D'un point de vue purement pratique, cela permet d'afficher l'arborescence que l'on souhaite voir apparaitre dans la barre d'adresse.
  • C'est également beaucoup plus explicite pour l'internaute (qui n'a plus besoin de nommer ses favoris/bookmarks puisque le contenu est dans l'URL).
  • Pour le référencement internet, les robots des moteurs de recherche collectent les adresses des pages web (URL) et y associent des champs lexicaux : Une URL de type http://www.e-majine.com/gerer-son-site-avec-e-majine-manage/, et qui comprend dans le contenu visible de la page des mots liés à la gestion de site, va être mieux prise en compte par le moteur de recherche, puisque les mots-clé associés au thème de la page sont repris dans l'adresse, qu'une URL de forme http://www.e-majine.com/1435423.html.

A contenus équivalents et en partant d'une page "nouvelle" (pas de liens externes pointant vers elle), le moteur affichera en priorité notre URL dans les résultats !

Enfin,

http://www.monsite.com/marequete.php?param1=moncritere&param2=autrecritere&variable=français

regroupe les inconvénients suivants : illisibilité, signification nulle pour l'internaute non spécialiste, caractères spéciaux (?/&/$/€,ç..) encodés et non pris en compte par la plupart des moteurs de recherche.

C'est une adresse qui ne sera pas retenue pour figurer dans les index des bases d'engins de recherche en réponse à la requête "naturelle" d'un internaute.

Accessoirement, c'est aussi potentiellement dangereux car cela fournit un bon indicateur pour toute personne malveillante qui tenterait d'accéder par déduction à d'autres contenus...

Je suis convaincu(e) ! Quand utiliser la réécriture d'URL ?


Lorsqu'il s'agit d'un site web dit "statique" (les pages sont assemblées à la main, et les liens vers les ressources et les autres pages sont connus d'avance par le webmaster), nul besoin de ré-écrire l'adresse puisque le webmestre peut choisir lui-même le nom à donner à ses fichiers.

Lorsqu'il s'agit de sites administrables, c'est à dire dont le contenu est créé puis publié au fur et à mesure, l'exercice est impossible puisque nul ne peut prédire les contenus qui vont être intégrés. Il s'agit alors de trouver un système qui va forger une adresse à partir d'éléments contenus dans et autour de la ressource.


L'état de l'art de la ré-écriture d'URL


Par défaut, la grande majorité des sites dits "dynamiques" servent leurs pages en laissant dans l'URL les paramètres qui sont passés via le langage interprété côté serveur, afin d'accéder à la base de données et de retourner les résultats correspondants à la requête de l'internaute.

Ce système est utilisé massivement par la plupart des outils dits "web 2.0", qu'ils soient blogs, forums ou CMS...

Concrètement, cela donne souvent, avec les différentes solutions du marché (exemples au hasard) :

  •      article.php3?id_article=765
  •      spip.php?article98
  •      /content/section/1/2/
  •      index.php?id=250
  •      /content/#more-55

Note : Certaines de ses solutions peuvent permettre la ré-écriture d'URL, à condition d'user de plug-in (greffons), et d'aller configurer et éditer manuellement des fichiers .php et .htaccess , et sous réserve de compatibilités entre versions; enfin sous réserve de compatibilité avec la configuration serveur de l'hébergeur...

E-Majine les surpasse en déclinant ce principe au plus petit élément rédactionnel publié sur le site, l'article.

En effet, par défaut (sans aucune configuration), E-Majine est optimisé pour le référencement naturel avec un système d'écriture d'URL qui reprend le chemin de votre arborescence (au minimum), puis le nom du fichier (si vous l'avez spécifié).

Ex : http://www.e-majine.com/concevoir-des-sites-internet-cms/solutions/les-produits-standards/34-gerer-son-site-internet.html

Et depuis la V1, c'est également tout le catalogue (et donc les produits...) qui bénéficie de cette fonctionnalité !

 Où est le piège ?



Il n'y en a pas ! E-Majine vous permet d'associer exclusivement une adresse optimisée à une page. Ainsi, pas de risque de se voir pénalisé par Google pour "duplicate content" (duplication de contenu > deux pages proposant le même code - visible et invisible - dans le but de posséder un plus grand nombre de pages indexées, et donc de toucher potentiellement plus d'internautes en squattant les places dans les pages de résultats des moteurs de recherche; en savoir plus sur le site de Google "outils pour webmasters").

Existe-t-il des contraintes ?


Bien entendu, dans le cadre d'une réécriture d'URL pour améliorer le positionnement de sa page dans les feuilles de résultats des moteurs de recherche, il ne faut pas s'imaginer qu'il suffit de truffer son adresse de mots-clés pour que l'affaire soit gagnée...
Tout comme pour les sous-domaines mieux notés que les répertoires, il faut penser à positionner les mots importants le plus près du nom de domaine possible (donc à gauche pour notre sens de lecture.) Ceux qui viennent après perdent en importance. Enfin, il est souvent question de limite du nombre de caractère d'une URL, variable tant que le serveur est capable de donner la page (sans quoi il retourne une erreur 414 - URI trop longue).

Voici ainsi quelques adresses ayant pignon sur web :

http://thelongestlistofthelongeststuffatthelongestdomainnameatlonglast.com/wearejustdoingthistobestupidnowsincethiscangoonforeverandeverandeverbutitstilllookskindaneatinthebrowsereventhoughitsabigwasteoftimeandenergyandhasnorealpointbutwehadtodoitanyways.html

Et une requête encodée :

http://www.google.com/search?hl=en&lr=&c2coff=1&rls=GGLG%2CGGLG%3A2005-26%2CGGLG%3Aen&q=http%3A%2F%2Fwww.google.com%2Fsearch%3Fhl%3Den%26lr%3D%26c2coff%3D1%26rls%3DGGLG%252CGGLG%253A2005-26%252CGGLG%253Aen%26q%3Dhttp%253A%252F%252Fwww.google.com%252Fsearch%253Fhl%253Den%2526lr%253D%2526c2coff%253D1%2526rls%253DGGLG%25252CGGLG%25253A2005-26%25252CGGLG%25253Aen%2526q%253Dhttp%25253A%25252F%25252Fwww.google.com%25252Fsearch%25253Fsourceid%25253Dnavclient%252526ie%25253DUTF-8%252526rls%25253DGGLG%25252CGGLG%25253A2005-26%25252CGGLG%25253Aen%252526q%25253Dhttp%2525253A%2525252F%2525252Fwww%2525252Egoogle%2525252Ecom%2525252Fsearch%2525253Fsourceid%2525253Dnavclient%25252526ie%2525253DUTF%2525252D8%25252526rls%2525253DGGLG%2525252CGGLG%2525253A2005%2525252D26%2525252CGGLG%2525253Aen%25252526q%2525253Dhttp%252525253A%252525252F%252525252Fuk2%252525252Emultimap%252525252Ecom%252525252Fmap%252525252Fbrowse%252525252Ecgi%252525253Fclient%252525253Dpublic%2525252526GridE%252525253D%252525252D0%252525252E12640%2525252526GridN%252525253D51%252525252E50860%2525252526lon%252525253D%252525252D0%252525252E12640%2525252526lat%252525253D51%252525252E50860%2525252526search%252525255Fresult%252525253DLondon%25252525252CGreater%252525252520London%2525252526db%252525253Dfreegaz%2525252526cidr%252525255Fclient%252525253Dnone%2525252526lang%252525253D%2525252526place%252525253DLondon%252525252CGreater%252525252BLondon%2525252526pc%252525253D%2525252526advanced%252525253D%2525252526client%252525253Dpublic%2525252526addr2%252525253D%2525252526quicksearch%252525253DLondon%2525252526addr3%252525253D%2525252526scale%252525253D100000%2525252526addr1%252525253D%2526btnG%253DSearch%26btnG%3DSearch&btnG=Search

Et avec E-Majine ?


De la même façon que l'écriture pour le web requiert un travail adapté (on appelle cette tâche optimisation des contenus), vous déclarez les règles que vous souhaitez voir appliquer à cette ré-écriture en signifiant à E-Majine les paramètres à intégrer dans l'URL.

Voici les différentes possibilités qui vous sont fournies pour faire du sur-mesure, sans connaissance particulière :

Nom de la page : c'est la partie finale de l'URL, placée donc à l'extrémité droite, et qui comporte l'extension du fichier. Il vous est ainsi possible d'associer à votre page un nom et une extension de votre choix (.html, .html, .php, .txt....)

Titre de la page : c'est la balise html <title> dont le contenu est affiché dans la barre du navigateur. C'est une balise primordiale dans le cadre du référencement naturel.

Pour le CATALOGUE E-COMMERCE, depuis la V1 d'E-Majine, il est possible de choisir un certain nombre de paramètres des fiches produits qui seront remontés dans l'adresse :

  •     Libellé
  •     Référence
  •     Propriété(s) additionnelle(s)
  •     Variante(s) de produits

Tout en ayant la possibilité d'inter-changer l'ordre de ces éléments dans la réécriture.

Il en va de même pour les fiches du module annuaire. Il est ainsi possible de choisir parmi les noms de catégories, et les noms des fiches. Par exemple : /liens/category-3-sites-de-salles-de-concerts.html

L'accès à la fiche de l'annuaire permet de remonter le titre de l'entrée dans le <title> de la page.
Utilisée conjointement avec la ré-écriture d'URL de l'arborescence dans E-Majine, vous allez ainsi obtenir des URL dites "propres", c'est à dire dont la syntaxe comprend des mots explicites et signifiants, sans caractère spécial (encodage, sigles, etc) qui pourrait en gêner la lisibilité.

Le même principe est décliné aux articles (de type actualités, évènements, en multi-publication...)

Le forum hérite quant à lui du passage des titres et de la description au niveau de la balise <title> et de la balise meta description.

La ré-écriture d'URL est également la méthode utilisée dans E-Majine pour gérer les exceptions, comme la fameuse page 404 ("page not found", page non trouvée (sur le serveur)), que vous pouvez choisir de diriger vers une page/rubrique spéciale (un plan du site ?), ou bien de ramener au niveau d'arborescence parent.

(A noter que les redirections au niveau des rubriques, si utilisées via les méthodes de publication, sont de type "permanentes" (entête HTTP 301)).

Ces possibilités de ré-écrire vos adresses vous épargnent le travail délicat qui est effectué en coulisse, basé sur des règles d'expressions régulières dont la moindre erreur (de logique ou de syntaxe) peut entrainer l'indisponibilité partielle ou totale de votre site !

Elles sont accessibles simplement, et ne demandent aucune connaissance informatique (E-majine corrige vos suggestions en remplaçant les caractères spéciaux et les espaces.)

Enfin, elles sont immédiates à mettre en oeuvre, et peuvent s'appliquer de façon individuelle à chaque page. Ainsi donc, on peut laisser au choix E-Majine gérer la ré-écriture automatiquement, ou attribuer arbitrairement (à posteriori) une adresse individuelle à une page. Et c'est ce qui fait l'atout incomparable d'E-Majine face aux autre solution qui ne peuvent qu'appliquer des règles de réécriture à priori (c'est à dire où il faut définir une règle qui sera appliquée de façon uniforme à toutes nos adresses) : dans le cadre d'un travail collaboratif sur un site E-Majine, la personne en charge du référencement peut venir optimiser individuellement les URL des pages et des articles crées par les rédacteurs même une fois les contenus publiés !

Nous aborderons dans un prochain billet la question d'accessibilité, en couvrant les notions de code standard conforme, de normes et de l'optimisation appliquée aux ressources dans E-Majine (code XHTML et CSS valides, attributs ALT, LONGDESC, LANG gérés nativement, etc...)

YF



Billet original sur Yann Faurie

lundi, mars 10 2008

En savoir plus sur les fonctionnalités proposées par E-Majine : LE SITEMAP

Les conseils prodigués ci-après vous permettront d'avoir le maximum de cartes en mains pour suivre et optimiser le référencement naturel de vos sites avec E-Majine.

1/ Qu'est-ce que c'est ?

Le Sitemap est un fichier au format XML le plus souvent (il peut aussi être au format .txt) qui liste les pages de votre site.
Le sitemap est depuis fin 2006 un standard informatique, dont on peut lire les spécifications sur le site sitemaps.org.

Il a longtemps été associé au moteur de recherche Google (d'où le terme lu un peu partout de "Google Sitemaps") puisque c'est ce dernier qui a contribué à le rendre populaire.
Il peut être généré par des programmes ou des applications en ligne, et la V1 d'E-Majine vous permet de le publier et paramétrer selon vos besoins.

2/ A quoi cela me sert-il ?

Le sitemap ("plan du site" en anglais) est destiné à indiquer aux robots des moteurs de recherche en un endroit toutes les pages de votre site, sans notion de hiérarchie ou d'arborescence. Les adresses absolues (déclaration de type : http://www.votresite.com/index.php ou http://www.votresite.com/rubrique2/sous-rubrique2/mon-fichier.php) se succèdent les unes à la suite des autres au sein de balises XML.

Le Sitemap est alors un autre plan du site ?

Oui, il est destiné aux "non-humains". Il est à différencier du plan du site "traditionnel" qui lui est destiné à être lu par vos internautes dans le but de leur faciliter l'accès aux rubriques et aux contenus parfois nombreux et imbriqués. Le plan du site qui vous est proposé comme méthode de publication avec E-Majine vous permet ainsi de délimiter le niveau d'imbrication de vos rubriques ainsi que la rubrique de départ afin de proposer éventuellement plusieurs plans pour des publics différents.

3/ A qui s'adresse t-il ?

Les moteurs de recherche listés ci-dessous et leur robots adhèrent au standard sitemap et sont donc capables de lire et parcourir votre fichier afin d'en extraire les liens :

Google
Yahoo!
Ask
MSN/Windows LiveSearch
Exalead

(Cette liste est donc susceptible de croitre puisque le sitemap répond à un standard pouvant être utilisé par tous.)

4/ Quel bénéfice puis-je en tirer ?

Le robot qui arrive sur votre site n'a pas à parcourir toute l'arborescence de vos pages avant de pouvoir les indexer, puisque vous lui en fournissez la liste au moyen de ce fichier. Cela vous permet donc d'optimiser votre référencement naturel en conférant une visibilité à toutes les pages désirées, même si
la citation d’une url de page dans un sitemap ne garantit pas son indexation par le moteur ! De même, les pages énumérées ne sont pas immédiatement indexées (le robot procède par étapes, et il est généralement constaté que l'affichage au sein des pages de résultat de recherche se fait progressivement, par petits groupes de pages).

5/ Comment procéder ?

Une fois que l'arborescence de votre site est faite, et que vous commencez à publier des contenus, vous avez la possibilité de générer le sitemap de façon automatique avec E-Majine depuis la version 1 de l'interface Manage (la version 0.15a vous permet de l'éditer après l'avoir récupéré par un autre biais).
Manage > Référencement > Sitemap

N'oubliez pas de supprimer de la liste ainsi générée les URL que vous ne souhaitez pas faire connaitre (rubriques invisibles par exemple).
Le Sitemap généré par E-Majine est compressé afin d'optimiser l'espace disque : sitemap.xml.gz (qui est parfaitement décompressé par les robots).

C'est tout ?

Non. Vous devez maintenant faire connaitre l'existence de l'adresse de ce plan aux principaux intéressés, à savoir les moteurs de recherche.
Pour ce faire, il existe plusieurs méthodes.
La plus simple est d'ajouter cette adresse au sein d'un autre fichier pouvant être également généré par E-Majine, le fichier robots.txt
Ce dernier faisant partie d'un protocole plus ancien et connu de tous les développeurs d'agents utilisateurs, il est demandé et lu par tous les robots lorsque ceux-ci accèdent à votre site par la racine. Depuis l'apparition du sitemap le standard a été modernisé afin que le robots.txt puisse également servir à faire connaitre l'adresse du sitemap (faire d'une pierre deux coups.)

La déclaration se fait de la manière suivante dans votre fichier robots.txt :

Plan Sitemap : "emplacement_Sitemap"
ce qui peut donner :
Plan Sitemap : http://www.medialibs.com/sitemap.xml.gz

Plus d'infos sur le protocole d'exclusion de robots : http://www.robotstxt.org/

Si vous souhaitez aller plus loin et obtenir des informations des moteurs de recherche en retour, il va vous falloir vous créer un compte (gratuit) sur certains de ces moteurs. Le plus connu, Google, propose depuis 2006 un service baptisé "outils pour webmasters" qui permet de suivre l'évolution de la présence des pages de son site sur son index, ainsi que des conseils basés sur les principes du référencement naturel. De même pour le sitemap, pour lequel le service susnommé de Google va vous indiquer s'il a bien été pris en compte par son robot, s'il ne comporte pas d'erreurs, et quand il a été parcouru pour la dernière fois .

Et après ?

Soyez un minimum patients... Progressivement les pages de votre site (celles indiqués sur votre sitemap) devraient être indexées par les robots, et donc ressortir sur les pages de résultats de moteurs de recherche par rapport à leurs contenus.

Au fur et à mesure de la vie de votre site, de nouvelles rubriques vont surement voir le jour, ainsi que de nouvelles publications de contenus.
Des mises à jour du sitemap sont donc à prévoir, puisque par défaut E-Majine ne peut décider pour vous ce qui doit-être référencé par les robots.
Une fois que vous avez généré votre nouveau sitemap, il faut penser à signaler aux robots qu'il a été mis à jour, afin que ceux-ci prennent les modifications en compte (le plus rapidement possible, en sachant que vous n'avez aucune - ou très peu d' - influence sur le délai ni les fréquences de passage des robots sur votre site).

Pour ce faire le Manage vous propose d'envoyer une requête à Google pour qu'il soit averti que vous avez mis vos pages à jour.
Cette opération s'appelle "PINGer" (prononcez "Pineguer").

Dans le cas de figure où vous avez également créé un compte sur d'autres sites de moteur, n'hésitez pas à reproduire l'opération pour leurs robots !
Voici les adresses à utiliser, notez bien qu'il vous faut changer les noms de domaine indiqué (www.e-majine.com) par celui de votre site ! Certaines adresses doivent également être encodées.

Ask.com: http://submissions.ask.com/ping?sitemap=http://www.e-majine.com/sitemap.xml
Google: http://www.google.com/webmasters/sitemaps/ping?sitemap=http://www.e-majine.com/sitemap.xml
Yahoo: http://search.yahooapis.com/SiteExplorerService/V1/updateNotification?appid=YahooDemo&url=http://www.e-majine.com/sitemap.xml
Exalead : http://www.exalead.fr/search/submitYourSitePage
MSN / LiveSearch : http://webmaster.live.com/ping.aspx?siteMap=http://www.e-majine.com/sitemap.xml

A VENIR :

Lors de mon prochain article, je vous parlerai d'une autre fonctionnalité très utile au référencement naturel : la ré-écriture d'URL (URL REWRITING), proposée depuis la version 0.15 dans l'interface Manage, et grandement améliorée depuis la V1 avec l'extension de ses fonctionnalités au catalogue.

Billet original sur Yann Faurie

jeudi, janvier 18 2007

[Référencement] Pour un meilleur positionnement dans les moteurs de recherche

Je vous fait part de l'une de mes lectures ... Frédéric de Villamil fait une petit point sur un retour d'expérience de modifications apportées sur son blog pour gagner un meilleur positionnement.

Ces conseils ont été prodigués par l'auteur du très bon blog Référencement, Design et Compagnie, se découpent en deux types : structurels et éditoriaux ...

  • le titre la page : e-majine ne permet pas encore de faire cela en automatique,( je le rajoute dans les évolutions à faire) mais en gérant vos titres manuellement il vous est possible de tout faire ...
  • le contenu avant le reste : nos templates de base sont fait ainsi ...
  • la hiérarchie des titres, d'un point de vue global la sémantique des balises dans le site : nos templates tentent déjà de respecter cela, et rien ne vous empêche de faire encore mieux ...
  • pour les conseils éditoriaux à vous de jouer et de bien expliquer tout ceci à vos clients ...

Si vous souhaitez poursuivre la discussion n'hésitez pas à créer un topic dans le forum ...

Billet original sur Ronan Cassin

lundi, avril 10 2006

Le référencement «honnête» est-il proche de l'accessibilité ?

Sur le site de "POMPAGE", un très bon article vous précise les similitudes entre le respect des règles d'accessibilité et un référencement "honnête" ....

A lire donc patiemment et maintenant Vous aimez l’accessibilité ? Les moteurs de recherche aussi!

Billet original sur Ronan Cassin

jeudi, février 9 2006

Vers une (r)évolution culturelle du référencement ?

Une bonne analyse de ce qui se prépare chez Google pour le référencement des sites à lire chez Abondance

Billet original sur Ronan Cassin