bg banner
fond

L'Essor du Web Sémantique

 

Deux applications ont connu un développement particulièrement intéressant dans ce contexte:

- Le Web de données (« Web of Data »): un des attraits principaux du Web sémantique est la possibilité de mettre ligne des données brutes. Le format de base du Web Sémantique se nomme RDF (pour « Resource Description Framework ») et est un standard recommandé par l’organisation faîtière du Web, le W3C. Un nombre toujours plus important de compagnies et d’organismes publics utilisent ce format pour publier leurs données en ligne, augmentant de facto leur visibilité sur Internet. Citons en exemple les gouvernement Américains1 et Anglais2, de grandes sociétés de détail (e.g., BestBuy ou Sears) ou des géants des médias comme le New York Times3 ou la BBC. La conséquence directe de cette mise à disposition de données est l'émergence d'un Web de données interconnectées (« Linked Data Web ») géant, qui pour la première fois permet l’automatisation de processus à l’échelle du Web. 

- La création de meta-données: en dehors du Web de données, un nombre sans cesse grandissant de sites Web utilisent le Web sémantique pour ajouter des métadonnées à certaines de leur pages. L'International Press Telecommunications Council (IPTC), par exemple, standardise actuellement un format4 permettant aux agences de presses et journaux en ligne d'annoter leur pages  afin que les robots d’indexation capturent leur contenu de manière plus ciblée. Selon le même principe, Microsoft, Google et Yahoo! ont récemment proposé une série de schémas de données5 afin de permettre une indexation plus intelligente des pages contenant du contenu sémantique. 

Mettre à disposition données et métadonnées gratuitement sur Internet, soit, mais dans quel but finalement? A en croire l'entreprise BestBuy, l'avantage est double: d'une part, un meilleur classement dans les moteurs de recherche, qui privilégient fortement les pages annotées sémantiquement dans leurs classements. Et une forte croissance de la fréquentation des pages en ligne, d’autre part, fréquentation qui a bondi de 30% grâce à l'utilisation des technologies Web sémantique dans le cas de BestBuy. 

Philippe Cudré-Mauroux

Philippe Cudré-Mauroux est président du GITI et professeur à l'Université de Fribourg où il dirige l'eXascale Infolab http://diuf.unifr.ch/main/xi/ . Il sera Program Committee Chair de l'International Semantic Web Conference 2012 à Boston, et In-Use Track Chair de l'Extended Semantic Web Conference 2012.

--

1 http://www.data.gov/semantic
2 http://data.gov.uk/linked-data
3 http://data.nytimes.com/
4 http://dev.iptc.org/rNews
5 http://schema.org/

Devenir Membre du GITI ?

Nos Partenaires

  • ceec
  • swissmedialogotop
  • logo-uts
  • logo he arc
  • ictswitzerland logo member neu
  • ict academy
  • image