Schema.org — Microdata pour Google, Bing et Yahoo!

Schema.org propose un ensemble de micro-données hiérarchisé destiné à donner du sens au marquage HTML qui structure les pages web. Ce système complet de microdatas est comparable à RDFa, à ceci près qu’il est proposé conjointement par Google, Bing et Yahoo! pour enrichir les résultats de leurs moteurs de recherche respectifs.

Pour vous faire une idée de la richesse de ce vocabulaire commun, il suffit de jeter un oeil sur l’ensemble de la hiérarchie disponible sur la page The Type Hierarchy. On le voit, ce vocabulaire a l’ambition de taguer l’ensemble de la production culturelle humaine, et plus à venir.

Thing

Au sommet de cette hiérarchie de micro-données, on trouve la «chose».Thing est décomposée en:

  • CreativeWork,
  • Event,
  • Intangible,
  • Organization,
  • Person,
  • Place,
  • Product.

CreativeWork

Chaque élément est lui-même structuré en sous-ensemble. Pour CreativeWork, nous avons par exemple :

  • Article,
  • Blog,
  • Book,
  • ItemList,
  • Map,
  • MediaObject,
  • Movie,
  • MusicPlaylist,
  • MusicRecording,
  • Painting,
  • Photograph,
  • Recipe,
  • Review,
  • Sculpture,
  • TVEpisode,
  • TVSeason,
  • TVSerie,
  • WebPage,
  • WebPageElement.

WebPageElement

Parmi les éléments qui permettent d’ajouter du sens aux balises HTML pour préciser leur portée. Par exemple, WebPageElement se subdivise en :

  • SiteNavigationElement,
  • Table,
  • WPAdBlock,
  • WPFooter,
  • WPHeader,
  • WPSideBar.

Exemple d’utilisation du schema « Movie »

J’ai repris un exemple de la documentation de schema.org en prenant la liberté de modifier le balisage HTML initialement proposé pour ajouter un peu plus de sémantique via une liste de définition. Un peu dans l’esprit de ce que j’avais fait pour le microformat hCard, souvent expliqué avec des exemples de marquage HTML un peu «léger».

<dl>
    <dt>Avatar</dt>
     <dd>Director: James Cameron (born August 16, 1954)</dd>
     <dd>Science fiction</dd>
     <dd><a href="../movies/avatar-theatrical-trailer.html">Trailer</a></dd>
</dl>

Fig. 1 : exemple de fiche pour le film Avatar sans les microdatas.

<dl itemscope itemtype ="http://schema.org/Movie">
    <dt itemprop="name">Avatar</dt>
    <dd>Director: <span itemprop="director">James Cameron</span> (born August 16, 1954)</dd>
    <dd itemprop="genre">Science fiction</dd>
    <dd><a href="../movies/avatar-theatrical-trailer.html" itemprop="trailer">Trailer</a></dd>
</dl>

Fig. 2 : même marquage qu’au-dessus avec les microdata issues de «Movie».

RDFa c’est fini ?

D’après Google, les site utilisant RDFa continueront à être valorisés en tant que Rich Snippets mais il ne dit pas pendant combien de temps…

Enfin une solution stable et pérenne pour enrichir nos données ?

Je suis un farouche supporter des microformats, mais j’ai toujours gardé également à l’esprit qu’il ne s’agissait globalement que d’un exercice de style. Je n’ai jamais pu observer un quelconque impact dans le fait de mettre des classes microformatées dans mes balises. Avec les schémas proposés par Google Bing et Yahoo! nous aurons peut-être plus de chances de voir nos efforts enfin récompensés. A tester et à voir.

→ Consulter HTML Microdata du W3C