Computer Parts in French - Les parties de l'ordinateur.pptx
Le statut des données de la recherche : entre droit des bases de données et données publiques
1. Le statut des données
de la recherche :
entre droit des bases de
données et données
publiques
Par Lionel Maurel
MESHS – Lille/Nor de France
Le droit d’auteur dans un environnement
numérique / Petits -déjeuners valorisation
2. A l’origine : « Information Wants to Be Free »
(Stewart Brand – 1984)
ImageparPierre-Selim.CC-BY
Les informations sont longtemps restées en dehors du champ de la propriété intellectuelle.
3. ImageparJennyMackness.CC-BY-NC.
L'UNESCO soutient fortement l'accès au domaine public informationnel ou
"indivis mondial de l'information". Ce domaine public informationnel est
constitué par l'information publiquement accessible, dont l'utilisation ne porte
atteinte à aucun droit légal, ne viole aucun autre droit communautaire (par
exemple les droits des populations autochtones) ou n'enfreint aucune
obligation de confidentialité.
Le domaine public informationnel englobe donc l'ensemble des oeuvres ou
objets de droits apparentés qui peuvent être exploités par quiconque sans
autorisation, par exemple parce que la protection n'est pas assurée en vertu du
droit national ou international, en raison de l'expiration du délai de protection,
ou à cause de l'absence d'un instrument international assurant la protection
dans le cas des oeuvres ou objets de droits apparentés étrangers.
Le domaine public de l’information de l’UNESCO (2011) (2011)
L’information conçue comme un « patrimoine commun » ou un bien public « pur ».
4. Les idées, les faits, les données restent « de libre parcours »
Une condition fondamentale pour la liberté de la recherche
ImageparGeralt.CCO
5. L’extraction des informations d’un livre…
… est un acte fondamentalement libre, lié à la
« liberté de lire » elle-même.
ImageparValentindeBourgognes.DomainePublic.
6. Mais avec le numérique, tout change…
Projet Text2Genome : 3 ans de négociations complexes pour pouvoir
constituer un corpus de 3 millions d’articles.
ProjetText2Genome
7. Depuis les années 90, les données sont peu à peu
saisies par le droit…
Directive 96/9/CE sur la protection juridique des bases de données du 11 mars 1996,
transposée en France par la loi du 1er juillet 1998 => Livre III, titre IV du Code de la
Propriété Intellectuelle
ImageparPostmasters.CC-BY-SA.
8. Plan de l’intervention
I) Définition légale de la base de
données
II) Incorporation d’éléments dans
une base
III) Protection de la structure
d’une base par le droit
d’auteur
IV) Protection du contenu d’une
base par le droit sui generis
V) Le nouvel enjeu du Text et
Data Mining
VI) Le statut particulier des
données de recherche et
l’Open Data
9. I) Définition de la base de données
Article L-112-3 CPI :
« On entend par base de
données un recueil d’œuvres,
de données ou d’autres
éléments indépendants,
disposés de manière
systématique ou méthodique,
et individuellement accessibles
par des moyens électroniques
ou par tout autre moyen. »
La loi ne définit pas en revanche la donnée :
« Représentation d’une information sous une forme conventionnelle
destinée à faciliter son traitement. »
Arrêté du 22 décembre 1981 sur l’enrichissement de la langue française
10. Quelques exemples de bases de données
– un fichier papier
Cour d’Appel de Paris, 12 septembre 2001 : Peu importe que la base de
données soit sous une forme papier, le support est indifférent.
12. Quelques exemples de bases de données
– un thesaurus
Anne-Laure Stérin : « Une liste alphabétique de mots n’est pas protégée par le droit d’auteur, si
elle constitue une compilation sans originalité. En revanche, une liste de mots présentant une
structure originale peut être protégée par le droit d’auteur. Un thésaurus par exemple, c’est-à-
dire une liste hiérarchisée de termes soigneusement sélectionnés est protégeable ».
13. Quelques exemples de bases de données
– une bibliothèque numérique
Conditions générales d’utilisation : « Gallica constitue une base de
données, dont la BnF est producteur, protégée au sens des articles L341-
1 et suivants du code de la propriété intellectuelle. »
15. Quelques exemples de bases de données
– un site internet
Mais la protection par le droit des bases de données n’est pas
automatique et le site doit répondre à un certain nombres de critères
(voir Cour d’Appel de Paris, 20 mars 2015).
16. Quelques exemples de bases de données
– une application mobile
Voir Murielle Cahen, La protection juridique d’une application mobile.
17. Trois « couches » différentes de protection
Protection par le
droit d’auteur
Protection par le
droit sui generis
Protection des
éléments
Image par Sametcaliskan. CC-BY
Tryptique : structure de la base / contenu de la
base / éléments constitutifs du contenu
18. II) Incorporation d’éléments dans une base
Directive 96/9/CE :
« La protection des bases de
données par le droit d'auteur
prévue par la présente directive
ne couvre pas leur contenu et
elle est sans préjudice des droits
subsistant sur ledit contenu. »
Les données peuvent être directement générées par le producteur de la base.
Elles peuvent aussi être incorporées à partir de sources extérieures.
Dans ce cas, attention aux droits de propriété intellectuelle et au droit des données personnelles.
19. Incorporation dans une base d’éléments protégés par
des droits de propriété intellectuelle de tiers
Les questions de droit d’auteur doivent être réglées sur une base contractuelle avec les
différents titulaires de droits (ici, auteurs des articles et éditeurs de la revue) avant
incorporation des éléments dans la base.
20. Incorporation de « faits bruts », appartenant au
domaine public informationnel
Mais il est souvent difficile de faire la distinction entre les œuvres protégées ou non, à
cause de l’imprévisibilité du critère de l’originalité.
Tribunal de commerce de Compiègne, 2 juin
1989 : « les cotations et négociations
boursières » constituent des « informations
brutes » et des « biens communs à tous dès leur
publication »... «la cote des bourses est un
document Minitel destiné à l’information du
public ; les cotations des valeurs ou de biens ne
sont pas, comme tout prix de produits,
susceptibles d’appropriation. »
21. Consécration d’une « liberté documentaire »
Cour de Cassation, 30 octobre 1987, Microfor contre Le Monde : « lL'édition à des fins
documentaires, par quelque moyen que ce soit, d' un index comportant la mention des
titres en vue d'identifier les œuvres répertoriées ne porte pas atteinte au droit exclusif
d'exploitation de l'auteur »
Création de la notion « d ’œuvre d’information » et consécration de la possibilité
d’indexer, de référencer, de produire des mots-clés, des résumés.
22. Mais manipuler de l’information peut s’avérer
dangereux…
Mais CJUE 16 juillet 2009 Infopaq : des citations de 11 mots d’articles incluses dans un
produit de veille de presse ont été considérées comme des infractions au droit
d’auteur…
Normalement, une base
de données est
considérée comme une
« œuvre citante »
permettant d’y incorporer
des courtes citations.
23. Incorporation
Incorporation d’éléments correspondant à des
données personnelles
Incorporer des
données
personnelles dans
une base
correspond à un
« traitement » au
sens de la loi
Informatique et
Libertés du 6
janvier 1978.
Les individus disposent (sauf exceptions) à un droit d’information,
d’accès, de rectification et d’opposition (opt-out) et non d’un droit
d’autorisation préalable.
24. III) Protection de la structure d’une base de
données par le droit d’auteur
Article 112-3 CPI : « Les
auteurs de traductions,
d'adaptations,
transformations ou
arrangements des oeuvres
de l'esprit jouissent de la
protection instituée par le
présent code sans
préjudice des droits de
l'auteur de l'oeuvre
originale. Il en est de
même des auteurs
d'anthologies ou de
recueils d'oeuvres ou de
données diverses, tels que
les bases de données, qui,
par le choix ou la
disposition des matières,
constituent des créations
intellectuelles.
Tribunal de Grande instance de Paris, 13 avril 2010, Optima on Line c/ Media Contact Israel : « pour que la base de
données puisse bénéficier de la protection du droit d’auteur, il faut démontrer que le choix et la disposition des matières
sont originaux c’est-à-dire qu’ils portent l’empreinte de la personnalité de son auteur »
Cour de justice de l’union européenne, 1er mars 2012, affaire C-604/10, Football Dataco Ltd et a. c/ Yahoo ! UK Ltd et
a : La protection de la base de données par le droit d’auteur est subordonnée la condition « que le choix ou la disposition des
données qu’elle contient constitue une expression originale de la liberté créatrice de son auteur ».
25. Originalité et structure d’une base de données
Cour de Cassation, 13 mai 2014, Affaire Xooloo : « la constitution de la base de données avait nécessité le découpage et l'analyse non seulement
de l'ensemble des pages et rubriques des sites sélectionnés mais aussi des liens mis en ligne par les éditeurs, pour s'assurer de la conformité de
chaque contenu avec les choix éditoriaux de la charte de la société Xooloo, et constate que la base de données se compose d'une longue liste
d'adresses URL renvoyant vers des sites, des rubriques de sites, et des pages, avec un portail thématique regroupant les adresses les plus
pertinentes listées par genre (musique, sport, voyages etc.), destiné à faciliter la navigation des enfants ; la cour d'appel en a déduit que la « liste
blanche » était le résultat de choix personnels opérés au regard de la conformité des contenus qui la constituent à la charte qui gouverne la
démarche de la société Xooloo, et traduisait un apport intellectuel, caractérisant, au regard des choix effectués et de la classification élaborées,
une oeuvre collective originale, éligible à la protection par le droit d'auteur »
26. Portée de la protection par le droit d’auteur
Article 5 directive du 11 mars 1996 : « L’auteur d’une base de données bénéficie, en ce qui concerne l’expression de cette base pouvant faire
l’objet d’une protection par le droit d’auteur, du droit exclusif de faire ou d’autoriser : a) la reproduction permanente ou provisoire, en tout ou en
partie, par quelque moyen et sous quelque forme que ce soit ; b) la traduction, l’adaptation, l’arrangement et toute autre transformation ; c)
toute forme de distribution au public de la base ou de ses copies. La première vente d’une copie d’une base de données dans la Communauté
par le titulaire du droit, ou avec son consentement, épuise le droit de contrôler la revente de cette copie dans la Communauté ; d) toute
communication, exposition ou représentation au public ; e) toute reproduction, distribution, communication, exposition ou représentation au
public des résultats des actes visés au point b) ».
La protection de la structure
va durer 70 ans après la mort
de l’auteur (personne
physique) ou de la publication
(personne morale)
27. Qui est titulaire ?
A qui appartient le droit d’auteur sur la
structure d’une base de données ?
En principe, le droit d’auteur appartient à l’auteur-personne physique, mais en matière de base
de données, les juges sont plus enclins à admettre la qualification d’œuvre collective » pour
les bases développées par une pluralité de contributeurs.
Article L113-2 CPI : « Est dite collective l’œuvre
créée sur l’initiative d’une personne physique ou
morale qui l’édite, la publie et la divulgue sous sa
direction et son nom et dans laquelle la contribution
personnelle des divers auteurs participant à son
élaboration se fond dans l’ensemble en vue duquel
elle est conçue, sans qu’il soit possible d’attribuer à
chacun d’eux un droit distinct sur l’ensemble
réalisé. »
28. Protection par le droit sui generis
IV) La protection du contenu de la base par
le droit « sui generis »
La loi française reconnaît en plus du droit d’auteur un droit sur le contenu des bases de données qui protège
son producteur, c’est-à-dire la personne qui a investi dans la base. Le producteur obtient ainsi le droit
d’interdire l’extraction de tout ou partie du contenu de la base sous certaines conditions. Ce droit permet de
protéger les investissements qui ont été faits sur la base.
La protection par le droit
d’auteur peut se cumuler
avec le droit sui generis,
mais une base à la
structure non-originale
peut tout de même être
protégée par le droit sui
generis .
29. Critère de protection par le droit sui generis : la
notion « d’investissements substantiels »
Article L. 341-1 du CPI : « Le
producteur d'une base de
données, entendu comme la
personne qui prend l'initiative
et le risque des
investissements
correspondants, bénéficie
d'une protection du contenu
de la base lorsque la
constitution, la vérification ou
la présentation de celui-ci
atteste d'un investissement
financier, matériel ou humain
substantiel.
Cour de justice de l’Union européenne, 9 nov. 2004 - aff. C-203/02, The British Horseracing Board Ltd et a.
c/ William Hill Organization Ltd : la « notion d’investissement lié à l’obtention du contenu d’une base de
données (...) doit s’entendre comme désignant les moyens consacrés à la recherche d’éléments existants et à
leur rassemblement dans ladite base », à l’exclusion des « moyens mis en œuvre pour la création des
éléments constitutifs du contenu d’une base de données » .
30. Un droit d’autoriser ou d’interdire les
« extractions substantielles » de données
Extraction =
réutilisation ou
reproduction par un
tiers de tout ou partie
du contenu de la base,
s’appréciant d’un point
de vue quantitatif ou
qualitatif.
+ les extractions non substantielles répétées => « Article L342-2 CPI : “l’extraction ou la
réutilisation répétée et systématique de parties qualitativement ou quantitativement non
substantielles” dès lors que les emprunts “excèdent manifestement les conditions d’utilisation
normale de la base de données”
31. La durée de la protection par le droit sui generis
Article L342-5 CPI : 15 ans à compter du 1er janvier suivant l’année d’achèvement de la base de
données ou sa mise à disposition au public, si cette mise à disposition intervient dans le délai de
15 ans. Cette protection est prolongée pour une nouvelle période de 15 ans après tout nouvel
investissement substantiel.
32. Une tendance au durcissement ?
L’ajout d’une protection par les conditions
générales d’utilisation
CJUE, 15 janvier 2015, Ryan Air : admission d’une protection par de simples clauses
contractuelles d’une base de données protégeable ni par le droit d’auteur, ni par le droit sui
generis et ne souffrant aucune exception.
33. Une tendance au durcissement ?
La consécration graduelle du « vol de données »
Cour de Cassation, 20 mai 2015, Affaire Bluetouff : pour la première fois, la Cour de Cassation
admet la qualification de « vol » s’agissant de téléchargement de fichiers informatiques, en
s’appuyant sur la loi Godfrain.
34. V) Un nouvel enjeu crucial pour la recherche :
la question du Text and Data Mining (TDM)
35. La fouille de données ou de textes nécessite généralement
que des copies ou des extractions de contenus soient
effectuées.
Or ces actes déclenchent en principe l’application du droit d’auteur et/ou du droit des
bases de données. Les exceptions traditionnelles conviennent mal (citation, illustration
de la recherche, copies techniques provisoires, etc).
36. Dans ce contexte, volonté des éditeurs scientifiques
d’imposer des licences pour le Text et Data Mining
Cette solution contractuelle a été fortement poussée au niveau
européen (processus Licences For Europe => Echec en 2013).
37. Les licences de TDM constituent une manière de « privatiser
Exemple de conditions
figurant dans la licence
TDM d’Elsevier :
- L'utilisation obligatoire de
l'API maison d'Elsevier ;
- Une limitation des extraits à
200 signes ;
- L'obligation de placer le
résultat de la recherche sous
une licence non-commerciale. ;
- L'obligation d'inclure un lien
DOI vers la source originelle
(article…)
Les licences de TDM constituent une manière de « privatiser
l’information », au-delà du droit des bases de données
De plus, les licences ne peuvent couvrir que les contenus fournis par des éditeurs
identifiés. Comment faire pour les explorations de données conduites sur le web, où
les titulaires peuvent être très nombreux ou difficilement identifiables ?
38. Position de LIBER, la ligue des bibliothèques de recherche
européennes en réaction à la politique de TDM d’Elsevier.
Volonté d’inscrire ces usages a minima dans une exception
au droit d’auteur.
Le droit de fouiller les
données doit rester un
corollaire du « droit de lire ».
39. En Angleterre, une nouvelle exception introduite en 2014
pour sécuriser les « analyses computationnelles » effectuées
dans un cadre non-commercial.
Aux Etats-Unis, de larges ouvertures en matière d’exploration de
données, considéré comme un usage transformatif couvert par le fair
use (usage équitable), y compris parfois dans un cadre commercial
(jurisprudence Google Books - 2013).
40. Pendant ce temps, en France...
Un rapport remis au Ministère de la Culture qui préconise un moratoire
sur deux ans et de privilégier les solutions contractuelles…
ImageparGillesSanMartin.CC-By-SA.
On ne peut ignorer que
l’activité d’exploration
de données se développe sur
la création et l’investissement
d’autrui, des bases de
données et des oeuvres. Sans
cet apport initial, l’exploration
de données ne pourrait ni
exister, ni développer de
valeur. En ce sens, dans
l’ordre des organismes
vivants, l’exploration de
données est de nature «
parasitaire ».
Rapport CSPLA sur le Text et
Data Mining. 2014
41. Pendant ce temps, en France...
La licence nationale conclue par Couperin avec Elsevier contient une
clause relative au Text et Data Mining, ce qui crée un précédent
important et légitime l’approche contractuelle.
42. Prochain enjeu : la réforme de la directive européenne sur le
droit d’auteur.
Révision annoncée par la Commission européenne à l’horizon 2016.
Le rapport de l’eurodéputée Julia Reda, adopté en commission JURI du Parlement européen,
recommande d’introduire une exception pour le Text And Data Mining, « à des fins de
recherche ».
The Hague
Declaration On
Knowledge
Discovery In The
Digital Age (2015)
43. VI) Le statut particulier des données
de la recherche et l’Open Data/Science
44. Le droit à la réutilisation des
informations publiques
Pas un droit de propriété, mais au contraire un droit de réutilisation reconnu au profit
des citoyens, pouvant toutefois être encadré et conditionné par l’administration
(notamment au paiement d’une redevance)
45. Article 10 / loi du 11 juillet 1978
« Les informations figurant dans des documents produits ou reçus
par les administrations mentionnées à l'article 1er, quel que soit le
support, peuvent être utilisées par toute personne qui le souhaite à
d'autres fins que celles de la mission de service public pour les
besoins de laquelle les documents ont été produits ou reçus. »
Par dérogation au présent chapitre, les conditions dans
lesquelles les informations peuvent être réutilisées sont
fixées, le cas échéant, par les administrations mentionnées
aux a et b du présent article lorsqu'elles figurent dans des
documents produits ou reçus par :
a) Des établissements et institutions d'enseignement et de
recherche ;
b) Des établissements, organismes ou services culturels.
Article 11 / loi du 11 juillet 1978
PrincipeException
Le régime dérogatoire des données de la recherche
Disparaît pour les
données culturelles dans
la prochaine directive,
mais pas pour les données
de la recherche…
46. Quelle portée exacte pour ce régime
dérogatoire ?
Dans le champ culturel, la justice administrative a réintégré les données des archives
publiques dans le champ du principe général de réutilisation (CAA Lyon, 4 juillet 2012).
47. Surprenant retour du droit des bases de
données contre le principe de réutilisation…
Concernant des services d’archives départementales, le juge administratif admet que
l’administration puisse invoquer le droit sui generis des bases de données pour faire
obstacle au principe de réutilisation (CAA Bordeaux 26 janvier 2015).
48. Un projet de numérisation de
livres anciens Des scans image et de l’OCR corrigé
Un encodage en TEI et la
production de métadonnées
Une valorisation éditoriale à travers un
site web et des articles de revue
Dans le cadre d’un projet de recherche, distinguer les
différentes « couches de droits »
49. Couche des données :
Couche des métadonnées :
Couche des contenus :
Statut des différentes « couches de droits »
50. Couche des données :
Couche des métadonnées :
Couche des contenus :
L’institution :
-Droit des bases de données appartient
au « producteur de la base de
données »
- Droit à la réutilisation des
informations publiques =
administration qui produit ou collecte
les informations
L’individu :
-Le droit d’auteur sur les œuvres
appartient en principe à l’individu
personne physique
- Mais les agents publics sont réputés
céder leurs droits sur leurs créations à
leur administration de tutelle
- Sauf pour les enseignants chercheurs
qui conservent pleinement leur droit
d’auteur.
Conséquences des statuts différents
51. Développement d’une politique d’Open Data
en France
Extension progressive de la gratuité et de la mise à disposition sous licence ouverte.
Possibilité que la gratuité devienne principe général applicable par défaut, à l’occasion
de la transposition de la nouvelle directive (par la loi numérique ?).
52. Juridiquement, l’Open Data est une renonciation à l’exercice
des droits sur une base de données
Vous êtes libre de réutiliser « l’Information » :
• Reproduire, copier, publier et transmettre « l’Information » ;
• Diffuser et redistribuer « l’Information » ;
• Adapter, modifier, extraire et transformer à partir de « l’Information », notamment pour créer des « Informations
dérivées » ;
• Exploiter « l’Information » à titre commercial, par exemple en la combinant avec d’autres « Informations », ou en
l’incluant dans votre propre produit ou application.
Sous réserve de :
• Mentionner la paternité de « l’Information » : sa source (a minima le nom du « Producteur ») et la date de sa
dernière mise à jour.
Droits de propriété intellectuelle
Le « Producteur » garantit que « l’Information » ne contient pas de droits de propriété intellectuelle appartenant à des
tiers.
Les éventuels « Droits de propriété intellectuelle » détenus par le « Producteur » sur des documents contenant
« l’Information » ne font pas obstacle à la libre réutilisation de « l’Information ». Lorsque le « Producteur » détient des
« Droits de propriété intellectuelle » sur des documents qui contiennent « l’Information », il les cède de façon non
exclusive, à titre gracieux, pour le monde entier et pour toute la durée des « Droits de propriété intellectuelle », au
« Réutilisateur » qui peut en faire tout usage conformément aux libertés et aux conditions définies par la présente
licence.
53. Dans le champ de l’enseignement supérieur
Ouverture de jeux de données par le Ministère de l’Enseignement et de la Recherche,
mais pour l’instant, aucune obligation sur les universités ou les établissements de
recherche.
54. Couche des
données :
Couche des
métadonnées :
Couche des contenus :
Différentes licences Open Data utilisables pour
les données de recherche
55. Incitation de l’Union Européenne à aller vers
une ouverture des données de la recherche
Open Data Research Pilot (2013) dans le cadre d’Horizon 2020 : incitation à utiliser les
licences CC-BY ou CC0 pour l’ouverture des données de la recherche
56. Progression du concept « d’Open Science »
Open Access +
Open Data +
Open Source =
Open Science ?
Ouvrir les données de la recherche dès le départ avec des licences
adaptées pour favoriser les usages en aval et ne pas avoir à les négocier
auprès d’intermédiaires.
Vers une Charte Universelle
de l’Open Science ?
(projet ADBU/CNRS)