Présentation
Objectif
DBpedia est un projet universitaire et communautaire d’exploration et extraction automatiques de données dérivées de Wikipédia qui rend ces informations disponible sur le Web. Son principe est d’organiser des données structurées au format du web sémantique extrait du site web collaboratif Wikipedia.
Données exposées
Les types de données exposées sont les suivants :
- 312 000 personnes
- 413 000 lieux
- 94 000 albums de musique
- 49 000 films
- 15 000 jeux vidéo
- 140 000 organisations (31 000 sociétés, 31 000 établissements d’enseignement)
- 146 000 espèces
- 4 600 maladies
- 1 461 000 liens vers des images
- 5,54 millions de liens vers des pages extérieures
- 4,87 millions de liens vers des datasets externes
- 565 000 catégories Wikipédia
- 75 000 catégories YAGO3
Ontologies utilisées
Le DBpedia utilise sa propre ontologie qui a été créé manuellement en basant sur les infoboxes les plus utilisés dans Wikipedia. Cette ontologie couvre actuellement 685 classes et 4,233,000 instances. Les classes se trouvent sur le lien de http://mappings.dbpedia.org/server/ontology/classes/. Le tableau ci-dessous montre le nombre d’instances de plusieurs classes :
Sites connectés
DBpedia est connecté aux nombreux datasets. La somme des connections est 39007478. Voici une liste non exhaustive :
Adresses du site
Les différentes adresses du site DBpedia sont les suivantes :
- Données HTML: http://dbpedia.org/
- Données RDF : http://wiki.dbpedia.org/Downloads2015-04
- SPARQL Endpoint : http://dbpedia.org/sparql
Exemples de requêtes
Ci-dessous est 15 requêtes de SPARQL ainsi que leurs résultats :
4.
6.
7.
8.
9.
10.
11.
12.
13.
14.
Notes et références
- Official website
- DBpedia – Extracting structured data from Wikipedia and LinkedGeodata, Wikimania 2009 talks about the DBpedia project.
- DBpedia: Querying Wikipedia like a Database – Chris Bizer, World Wide Web Conference Developers Track, 11 May 2007
JIN Zhichuan
CHEN Haoyue
PENG Yuancheng