Google de A à Z (bêta)

google-de-a-a-z.png Au début, une manipulation hasardeuse : j’ai appuyé un peu trop vite sur Enter après avoir saisi la lettre a dans Google. Intrigué par la présence du site Le Monde en première position, j’ai voulu connaître le sort réservé aux autres lettres de l’alphabet. De prime abord, les résultats semblent suggérer que Google dispatch les pages selon des catégories thématiques comme je l’ai évoqué dans le billet Mesure d’audience : des mots-clefs au ClickRank. Avant que vous ne me le demandiez, j’ai fait ma petite enquête en notant quelques informations pour chaque série de résultats :

  • la lettre de l’alphabet avec la requête vers les résultats,
  • la première URL retournée,
  • le résumé donné par le moteur,
  • la catégorie thématique du site,
  • une capture d’écran des trois premiers résultats au minimum, avec le plugin SEO for Firefox (Beta) pour Firefox,
  • un commentaire sur les résultats.

Ce billet est en version bêta. Celà signifie que la peinture est encore fraîche et que des modifications peuvent intervenir sans préavis en raison de la nature fluctuante des résultats fournis par les moteurs de recherche. Si toutefois une modification était effectuée suite à un commentaire, ce dernier serait bien évidemment mentionné quelque part. Je précise également qu’il ne s’agit pas (loin de là) d’une étude statistique faite dans les règles de l’art. Je dirais plutôt que ce billet est le fruit d’une recherche ludique au début qui a mal tournée ensuite 😉

Partie I — Analyse rapide des résultats

Les préférences de Google

Bien que les requêtes sont effectuées sur Google.com, le choix de la Langue de l’interface dans les préférences du moteur pour Afficher les conseils et les messages Google en langue : Français, favorise bizarrement les sites en langue française. Je dis bizarrement car je croyais que l’option Langue de recherche remplissait cette fonction en raison de son intitulé plus évident. Mais je suis peut-être le seul à me poser la question.

Les premiers de la classe

Quels sont donc les sites qui parviennent à se positionner en première place sur une requête comportant une seule lettre. Voyons le profil général de ces heureux élus :

  • Les sites liés au savoir, (c, h, j, n, o, r, s, u, v, x) : 10, soit près de 38,4%,
  • Les médias (a, d, e, j, l, z) sont relativement bien présent : 6 au total qui représentent 23% des résultats.
  • Le commerce (b, p, w) est présent avec 3 réprésentants, soit 11,5%,
  • Le secteur de la musique (f, k, m), représente 11,5% avec 3 résultats,
  • 3 services internet (g, t, y), soit 11,5% du total.
  • 1 intranet (q), soit 3,8%.

Par ailleurs, les sites à vocation commerciale, en réunissant les médias, la musique et le Commerce, représentent 46% du total.

Si maintenant on prend en compte les trois premiers résultats, on s’aperçoit que la part des médias, du savoir, de la culture et du divertissement en général se taille la part du lion avec plus de 70% du total ! Ce chiffre suggère l’existance d’un cluster dans lequel google range les pages visitées, ou que ces domaines ont une attirance forte pour les lettres de l’alphabet. Ce qui est assurément le cas, par exemple, pour f, j, k, l, m .

Pertinence par rapport à la requête

  • 15 sites sont pertinents par rapport à la requête (65.3%) : b, c, e, f, g, j, k, m, o, p, r, u, x, y, z,
  • 5, restent dans le domaine du pourquoi pas (19,2%) : l, n, q, t, w,
  • 6, pour lesquels on peut franchement se poser la question (23%) : a, d, h, i, s, v.

23% des sites ne semblent pas être à leur place. C’est à la fois peu et beaucoup. Peu si on considère que la nature des requêtes est très large, et beaucoup quand on pense qu’il s’agit tout de même des premiers résultats, parfois sur plus d’un million de pages.

Le PR, le PR !

Si le classement des résultats ne suit pas exactement l’ordre d’importance du PageRank, les résultats sont globalement cohérents avec l’idée qu’on s’en fait généralement : si un bon PR ne garantit pas un bon classement, ce dernier favorise les bon PR :

  • Ainsi, à 14 reprises, l’ordre des 3 premiers résultats suit le PR : a, d, g, h, i, l, n, o, q, t, u, v, w, y.
  • A 6 reprises, la progression n’est pas totalement respectée, mais les variations sont faibles : b, c, e, f, j, r.
  • Par 3 fois, l’ordre des résultats subit une variation relativement importante, mais garde une certaine cohérence avec le contenu des sites si on garde en tête que google classe les pages dans des cluster et en privilégie sans doute certains : k, m, z
  • Enfin, 3 séries de résultats possèdent une structure assez étrange au niveau de la progression du PR : p, s, x.

Partie II — Les résultats « à la lettre »

a
www.lemonde.fr/
LE MONDE, Journal Le Monde, quotidien d’information francophone / Le Monde, the french quality newspaper of record.
Média

Avec la lettre a, les résultats sont assez clairs : le site Le Monde a un PR8, possède plus de 1 Millions de liens d’après Yahoo! C’est une référence en matière d’information et le nombre de fois où le A de A la Une est imprimée justifie cette 1re place. En ce qui concernt le CEA, suis un peu plus mitigé, mais ne connaissant pas le milieu de la recherche nucléaire, je ne m’attarderais pas sur la question 😉 En revanche le 3ème résultat est plus surprenant puisque avec un PR7 le site Alapage, plus bas dans la page, aurait été plus judicieux.

b
www.agnesb.fr/
Retail and online boutiques featuring the designer’s clothing for men and women.
Commerce

Agnès b se place deux fois. Une première fois avec

le .fr et une description en anglais, et une seconde fois avec le .com décrit en français ! Ici on voit bien que malgré le PR7 du journal d’un geek, la notoriété du monde physique d’Agnès b semble l’emporter. A moins que deux pages de PR 6 font un PR12 ? Les geeks de chez Google s’habillent peut-être chez Agnès b ? Allez savoir…

c
http://fr.wikipedia.org/wiki/C_(langage)
C’est un des langages les plus utilisés pour plusieurs raisons : … Ken Thompson avait développé un prédécesseur de C, le langage B. Dennis Ritchie a fait …
Savoir

Pas de réelle surprise avec la lettre c. Le langage du même nom l’emporte à deux reprises et le 3ème site a un bon PR6 et un nom de domaine qui commence par la lettre en question.

d
www.dna.fr/
L’actualité de la région Alsace, mais aussi française et internationale. Rubriques Actu en temps réel, Entreprises, Sport, petites annonces, programmes télé …
Média

Si le d’ d’Alsace suffit à se placer aussi haut sur Google, je veux bien en mettre partout, d’accord ? Plus sérieusement la seule justification à cette première place, c’est l’appartenance au cluster Presse que Google semble chouchouter… et les deux résultats suivants sont eux aussi dans le cluster global Média, culture, savoir, etc.

e
www.eonline.com/
Breaking headlines, celebrity gossip, games, and community.
Média

Ici le 1er résultat semble tout à fait justifié, sauf que, puisque Google privilégie les sites en langue française pour mes requêtes, pourquoi donc un site anglo-américain ? Vu le nombre de sous-liens dont il bénéficie, c’est sûrement un site trop de la balle pour que Google nous en prive. D’ailleurs, le code source a l’air clean, et les intégrateurs doivent bien rigoler à lire tout ces potins 😉 Les 2 résultats suivants sont eux aussi dans le domaine des médias…

La grosse surprise de ces résultats provient des publicités pour eBay qui s’invitent dans les résultats naturels, ce que Google avait juré de ne pas faire pour préserver l’intégrité des résultats naturels. Et le moteur récidive sur les lettres w et q !

f
www.fcom.fr/
Left menu. NEWS · WHAT IS FCOM ? ARTISTES · DATES · FREE TRUCS · CATALOGUE · LIENS · FORUM · CONTACT · DEMO · F… U! FCOM …
Musique

Fcom, qui me fit découvrir la musique de Mr Oizo caracole en tête avec un PR5 malgré la concurrence du savoir et du changement climatique.

g
http://gmail.google.com/
Google-owned, web-based email service that includes over 2 gigabytes of storage (and growing).
Service internet (mail)

On n’est jamais si bien servi que par soi-même ou charité bien ordonnée commence par soi-même. Choisissez votre dicton selon votre sensibilité, mais les faits sont là… Gmail avec une description en anglais, en plus. Ce qui est surprenant c’est le peu de liens Y! (163,000) comparés aux 389,000 pour le point G 😉

h
www.univ-nancy2.fr/poincare/
Centre de l’université de Nancy 2 consacré à l’épistémologie et à la philosophie des sciences. France.
Savoir

Que le Serveur W3 des Archives H. Poincaré arrive en 1re position sur h devant l’Arthur du même nom a de quoi surprendre les plus blasés. Et le PR7 n’explique pas tout (d’ailleurs le PR n’explique rien, il constate). Y aurait-il une hiérarchie dans les clusters ? Le savoir aurait-il un poids supérieur à la musique ? La personnalité des fondateurs du moteur va bien dans ce sens. Quoique ce n’était pas le cas pour la lettre f (Comprends plus rien, moi…).

i
www.univ-rennes1.fr/
Sciences et technologie, médecine, pharmacie, odontologie, droit, économie, gestion, philosophie.
Savoir

Alors là, c’est pareil ! Cette avalanche d’universités sur cette lettre i qui ne demandait rien à personne m’esbrouffe.

j
www.canalj.net/
Retrouve tes héros: Mary Kate et Ashley, Titeuf, Yu gi oh, Code lyoko, kid paddle, jimmy neutron, lollytop, lucky luke, Re-7 (astuce jeu vidéo).
Média

Voici des résultats bien propres sur eux : une chaine TV, un site de divertissement et une librairie philosophique… S’il y a une lettre à garder dans l’alphabet pour passer de bons moments, c’est sûrement celle-ci, et le reste des résultats le confirme.

k
www.sitedek.ch/
Le site officiel de K, actualités, d

ates de concerts, videos, musique, chansons, forum.

Musique

Avec un PR4 le site de K passe devant des PR7 et PR5… Les 3 sites font pourtant partie du cluster Média, culture, savoir… Allez savoir 😉

l
www.lequipe.fr/
Suivez l’actualité des sports en direct, les analyses, les résultats sportifs, les calendriers des événements sportifs.
Média

Tir groupé sur les ténors de la presse écrite dans l’ordre du PR et dans l’ordre du nombre de lecteurs. Encore une fois, Google chouchoute bien la presse française ^^

m
www.qui2nous2.com/
le site officiel de M, toute l’actualite, videos, concerts, goodies, news, interviews, reportages exclusifs.
Musique

M en première position devant M6, ça fait plaisir et ça fait deux fois qu’un site musical passe devant des plus gros PR.

n
www.nplusi.com/
Program for international applicants for studying engineery in France, Programme pour étudiant français voulant étudier l’ingéniérie à l’étranger.
Savoir

Encore des sites liés au savoir ou aux média avec une bonne progression du PR. En revanche pour la progression des Y! links… C’est pas encore ça.

o
www.oreilly.fr/
Editeurs de livres sur l’informatique et les logiciels. Présentation des produits, liens vers les sites d’achat en ligne.
Savoir

Un éditeur ultra connu en Europe et aux Etats-Unis, une TV et un Institut National des Langues et Civilisations Orientales (pour ceux qui n’aurait pas le temps de reproduire la recherche).

p
www.pointp.fr/
Distributeur de matériaux de construction divers et variés. Nombreux services disponibles tel que la présentation de la gamme de produits et des différentes …
Commerce

Point P est l’un des rares site de commerce à être bien placé… Un rapport avec les AdWords ? (Je ne suis pas de mauvaise foi, je m’interroge, ce n’est pas la même chose…)

q
www.qpat.com/
QPAT. • English version. • Version sécurisée. • Guide Utilisateur. Service Clients. • Abonnez-vous. • Rapport d’incident. • Assistance Clients …
Commerce

QPAT semble être l’intranet de la société Questel qui gère tout ce qui concerne les brevets au niveaux mondial. Pour le reste, le tri alphétique de la Bibliothèque Nationale de France semble booster les requêtes sur la lettre Q. Quand au dernier résultats, il s’agit d’un site de vente de musique anglais.

Une fois encore la publicité s’invite dans la recherche naturelle… avec une élégance et une grâce…

r
www.r-project.org/
R, also called GNU S, is a strongly functional language and environment to statistically explore data sets, make many graphical displays of data from custom …
Framework (programmation)

Je ne connaissais pas le langage R qui est je cite : a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS

s
www.utm.edu/departments/french/french.html
– TennesseeBob’s Famous French Links – 2nd Edition – Now a 10000-Link Globe-Gate Supersite Son historique en français …
Savoir

Une page non-trouvé en 2ème position avec un PR0, c’est original…

t
http://chat.voila.fr/
Choisissez un pseudo pour t’Chatter … Nouveau sur le t’Chat ? Entrez dans la salle voila.fr (16) … Vos réactions sur le t’Chat 2003 dans le forum …
Service internet

J’ai beaucoup utilisé les t’chat Voilà dans ma jeunesse, j’ignorais qu’ils existaient encore :p

u
www.u-psud.fr/
Université Paris-Sud XI. Enseignement et recherche multi-domaines répartis sur sept composantes.
Savoir

Tir groupé sur les universités, avec une bonne raison pour chacune d’entre elles.

v
www.univ-paris5.fr/
class= »desc »>Droit, sciences humaines, médecine, odontologie, pharmacie, sciences. STAPS, IUT.

Savoir

Du savoir, du divertissement et de la lecture.

w
www.starwoodhotels.com/whotels/
It starts with the name. W…for warm, wonderful, witty, wired. W for welcome. W Hotels invite you to a new brand of hotels, providing the personality and …
Commerce

Je me suis beaucoup interrogé sur la présence du starwoodhotels quand je me suis rappelé qu’il a été un des 1er site à vocation commerciale à utiliser Flash pour l’ensemble des opérations : du choix de l’hôtel à la réservation.

Le plus étonnant c’est la présence de publicité au sein même des résultats naturels. Ca ne se voit pas dans la capture, mais après l’interlude Wanamoo, les résultats naturels continuent comme si de rien n’était.

x
www.polytechnique.fr/
Actualité Accord-cadre X CNRS EADS. Actualité Admissions internationales. Concours 2007 Vacances d’emploi. Campus Visite virtuelle de l’École …
Savoir

X pour polytechnique 😉 c’est d’un goût… Paris X est bien placé et on sent bien qu’il lui suffirait d’un petit coup de PR pour remonter à la première place. Allez Paris X, encore un effort ! Le plus drôle, c’est quand même la présence des films X en 3ème position avec un PR0 juste devant Mac OS X. Je me demande si les rapports entre Apple et Google sont si bons de ça ?

y
http://mail.yahoo.com/
Take a closer look at Yahoo! Mail. Get these great features: Powerful protection against spam and viruses, 1GB of email storage, PhotoMail, message size up …
Service internet

Y! a pas de mal à faire plaisir aux partenaire, histoire de ne pas faire de jaloux 😉

z
www.ztele.com/
La télé du futur. Al’affût des dernières tendances dans les domaines de la technologie, du multimédia et de la science-fiction. Magazine, grille horaire et …
Média

Un PR3 au milieu de deux PR6, pour Lorie en plus 😉 Mais bon, 280 boutiques en France et en Europe, ça vaut bien un petit effort 😉

Conclusion bêta ?

Ici se termine ce tour d’horizon sur Google de A à Z. J’espère que ce billet a été plus agréable à lire qu’à écrire (un peu fastidieux a finaliser, mais quand le vin est tiré, il faut le boire, n’est-ce pas ?). Pas de conclusion pour l’instant (bêta oblige) car j’attends vos impressions avant d’investir (encore) du temps sur ce billet. C’est ma vision personnelle du billet 2.0 : vous faire participer à l’élaboration du contenu ! Merci de votre compréhension.

Vous avez bien mérité un petit lift