|
Au départ le web 1.0... une
vaste bibliothèque de contenu textuel…
Ni plus ni moins.
A
l’époque les entreprises recopiaient ou scannaient leur plaquette, les
mettaient sur leur site, et le patron bombait le torse en donnant sa
carte de visite avec une adresse internet !
Les livres / sites
rangés étaient bien classés dans des rayons / catégorie d’annuaire,
chaque site devant au préalable être lu par le bibliothécaire / le
responsable de la catégorie.
Nomade, Excite, Voila…
Nostalgie ... L’époque où c’était tellement facile de se positionner dans une catégorie ! ;-) (Mon site sur les simpsons était dans les premiers dans la catégorie dédiée Yahoo => Petite fierté ! )
|
Et puis ils ont eu la mauvaise idée de déshumaniser la bibliothèque…
Les humains n’étaient pas assez rapides pour indexer l’information !
Ils ont remplacé la bibliothécaire / le responsable de la catégorie de l’annuaire par un crawler, c'est-à-dire un vulgaire robot…Ah la modernisation !
Au départ le robot n’était pas très malin.
Il se fiait à des étiquettes ou méta balises. (contenu invisible de
l’internaute et pourtant présent dans les pages HTML). Les créateurs de sites se sont donc naturellement mis à mettre
l’étiquette « sex » sur leurs sites. Peut importe la réalité, ça attirait du trafic !
(Parce que figurez-vous qu’à l’époque, le sexe attirait une forte
audience sur Internet… Dingue ça non ?)
Et le robot se laissait berner…
Pas pour longtemps !
Les géniaux créateurs du robot l’ont amélioré. Si les étiquettes n’avaient plus aucune valeur, il fallait se fier au
texte visible de l’internaute…
Eureka !
Est apparue la notion de densité par mot clé…
Le robot cernait les occurrences les plus répétées sur la page, et en
déduisait la thématique principale de la page.
Déjà à l’époque, le référencement était injuste :
Il y a ceux qui connaissaient les techniques, et ceux qui le faisait
avec le cœur…Et face à un robot, le cœur n’a pas sa place, le robot calcule !
Les créateurs de site se sont alors mis à répéter les mots clés dans le
footer de la page, à camoufler du texte noir sur fond noir etc…
Pour mettre un peu d’ordre dans ce beau bordel, le robot s’est mis à
générer un indice, le pagerank.Cette indice variait de 1 à 10 et permettait au robot de s’organiser.
Il traitait en priorité les informations provenant d’un fort
pagerank. Il fallait un temps certain pour obtenir un bon pagerank, et les
nouveaux sites peinaient plusieurs mois avant d’espérer attirer du
trafic donc à sortir du lot !
Et puis le web est devenu 2.0…
Les gens échangeaient, les blogs apparaissaient, les liens se créaient
en masse. La bibliothèque était devenue un espace d’échanges, de débats, et les
gens venaient plus pour partager que pour lire !
Le robot s’est là encore adapté, et s’est mis à privilégier des
indices + sociaux…Le pagerank a évolué pour intégrer en priorité le nombre de liens
entrants…Est apparue la notion de Trustrank…
Derrière cette apparente humanité, là encore une mécanique bien
huilée.Si un site populaire fait un lien vers un autre site, c’est que le site
doit avoir de l’importance…L’échange de liens est alors venu s’ajouter à la panoplie du
référenceur expert…
Il y’a eu les sites peu scrupuleux qui vendaient ces précieux liens
(les fameuses fermes de liens blacklistées par Google)…
Plus récemment il y’a eu les billets sponsorisés, qui permettaient
d’obtenir moyennant argent des liens entrants en provenance de blogs…
(et la lutte de Google aux états unis, pour obliger les liens de ces
billets sponsorisés à intégrer la balise no follow, c'est-à-dire pour
faire en sorte qu’ils ne puissent influencer le petit robot pas bien
malin).
Et force est de constater qu’année après année, le
robot s’est en partie embourbé pour plusieurs raisons
- Son algorithme ayant été pensé à l’heure de l’internet
Bibliothèque, il repose encore à 100% sur le contenu textuel de la page
pour cerner la thématique d’un site.
A l’heure ou les interfaces riches et site e-commerce sont de plus en
plus courants, il parait donc bien rouillé pour indexer ce type de
contenu…
- Son algorithme est encore trop peu réactif… il va certes chercher
tous les jours les nouveautés de ses sites chouchou (possédant un
excellent trustrank), mais il n’a pas de condescendance pour les petits
nouveaux (A l’opposé de son grand rival Twitter bien connu pour son
exceptionnelle réactivité).
Avec Twitter, le social shopping, l’émergence de sites comme digg,
friendfeed et wikio, l’avis des internautes en temps réel prend une
place de plus en plus importante dans la recherche d’informations…
Le robot en a pris de la graine.
Le robot est maintenant en train de le doter de 2
nouvelles fonctionnalités :
- Un digg like intégré dans la SERP (Search Engine Result Page)
Pour l'instant réservé aux personnes qui ont un compte Gmail, et qui voient 2 nouveaux attributs sur la SERP
- une
petite flèche pour aller plus haut
- une
petite flèche pour supprimer le lien…
Il y a fort à parier que les votes de ce digg like ouvert à tous
rentrera d’ici peu dans l’algorithme de positionnements des sites !
Malin le robot… ;-)