Presentation for the 2014 edition of So Data, a French annual conference on data science. It adresses mostly the positive relationship between the Wikimedia projects and the semantic open data movement and provides a brief introduction to DBPedia, Semanticpedia and Wikidata.
1. Wikimedia ♥ Open data
A Love Story
Pierre-Carl Langlais (Wikimédia France)
Alexander Doria (Wikipédia)
@Dorialexander (Twitter)
HotelWikipédia (Rue89)
dimanche 16 mars 14
4. Comment le web sémantique a
failli devenir le web 2.0
The SemanticWeb is not a separateWeb but an extension of the
current one, in which information is given well-defined meaning, better
enabling computers and people to work in cooperation.The first steps
in weaving the SemanticWeb into the structure of the existingWeb are
already under way. In the near future, these developments
will usher in significant new functionality as machines become much
better able to process and "understand" the data that they merely
display at present.
Tim Berners-Lee, The SemanticWeb, 2001
dimanche 16 mars 14
15. Une bonne indexation
Le code source wikimédien : un terrain de jeu idéal pour le
parsing. Extrait du « Bastards Books of Ruby »
dimanche 16 mars 14
17. Des informations fiables
Résumé de l’état de l’art par Piotr Konieczny :
« Wikipedia works in practice, not in theory »
dimanche 16 mars 14
18. Des utilisations croissantes
La plupart des 7000 articles de recherche consacrés à
Wikipédia recensés par Nicolas Jullien (2012) utilisent
Wikipédia comme une source d’information
dimanche 16 mars 14
29. Wikidata
Une coupure progressive avecWikipédia : les imports
automatiques de données deWikipédia, sans source tierces, ne
sont pas recommandés…
dimanche 16 mars 14
30. Wikidata
Les données sont ajoutées dans une interface spécifique :
un quintuplet sujet-prédicat-objet-qualificateur-références
dimanche 16 mars 14
31. Un choix philosophique
A challenge is that the traditional « top-down » model of
designing an ontology or schema before developing the data
breaks down at the scale of theWeb: both data and metadata
must constantly evolve, and they must serve many different
communities. Hence there has been a recent movement to
build the SemanticWeb grass-roots-style.
Auer et alii, « DBPedia, a nucleus for a web of open
data », 2007
dimanche 16 mars 14