SPARQL – DBpedia

Présentation

Objectif

DBpedia est un projet universitaire et communautaire d’exploration et extraction automatiques de données dérivées de Wikipédia qui rend ces informations disponible sur le Web. Son principe est d’organiser des données structurées  au format du web sémantique extrait du site web collaboratif Wikipedia.

Données exposées

Les types de données exposées sont les suivants :

  • 312 000 personnes
  • 413 000 lieux
  • 94 000 albums de musique
  • 49 000 films
  • 15 000 jeux vidéo
  • 140 000 organisations (31 000 sociétés, 31 000 établissements d’enseignement)
  • 146 000 espèces
  • 4 600 maladies
  • 1 461 000 liens vers des images
  • 5,54 millions de liens vers des pages extérieures
  • 4,87 millions de liens vers des datasets externes
  • 565 000 catégories Wikipédia
  • 75 000 catégories YAGO3

Ontologies utilisées

Le DBpedia utilise sa propre ontologie qui a été créé manuellement en basant sur les infoboxes les plus utilisés dans Wikipedia. Cette ontologie couvre actuellement 685 classes et 4,233,000 instances. Les classes se trouvent sur le lien de http://mappings.dbpedia.org/server/ontology/classes/. Le tableau ci-dessous montre le nombre d’instances de plusieurs classes :

sparql1

Sites connectés

DBpedia est connecté aux nombreux datasets. La somme des connections est 39007478. Voici une liste non exhaustive :

sparql2

Adresses du site

Les différentes adresses du site DBpedia sont les suivantes :

Exemples de requêtes

Ci-dessous est 15 requêtes de SPARQL ainsi que leurs résultats :

1.snapshot30

2.snapshot31

3.snapshot25

4.

snapshot26

5.snapshot40

6.

snapshot28

7.

snapshot29

8.

snapshot32

9.

snapshot33

10.

snapshot34

11.

snapshot35

12.

snapshot36

13.

snapshot37

14.

snapshot38

15.snapshot39

 

Notes et références

  1. Official website
  2. DBpedia – Extracting structured data from Wikipedia and LinkedGeodata, Wikimania 2009 talks about the DBpedia project.
  3. DBpedia: Querying Wikipedia like a Database – Chris Bizer, World Wide Web Conference Developers Track, 11 May 2007

 

JIN Zhichuan

CHEN Haoyue

PENG Yuancheng

Ce contenu a été publié dans Web Sémantique. Vous pouvez le mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *