SlideShare ist ein Scribd-Unternehmen logo
1 von 5
Downloaden Sie, um offline zu lesen
Le centre d’accès sécurisé aux données
            de la statistique publique française :
             un nouvel outil pour les chercheurs
                                                                                     !Jean-Pierre Le Gléau * et Jean-François Royer **
En 2010, l’Insee a mis en place un nouveau dispositif d’accès aux fichiers individuels de la
statistique publique, essentiellement à destination des chercheurs : le CASD, « centre d’ac-
cès sécurisé distant ». Rendu possible par l’évolution récente de la loi de 1951 sur le secret en
matière de statistiques, il permet d’accéder à des données individuelles selon une procédure
très réglementée. Cet article en donne une présentation générale.




L
       a protection de la confiden-                           pression pour que ces désagrégations        c’est-à-dire en pratique des données
       tialité des données recueillies                        soient de plus en plus fines est allée      sur des entreprises ou des établisse-
       à des fins d’établissement de                          en croissant au fil des années, au fur et   ments - la loi de 1951 a dès l’origine
statistiques est un des principes ma-                         à mesure du progrès des techniques et       prévu la possibilité de dérogations
jeurs de la statistique publique. Dès                         des outils d’analyse statistique dans       au secret statistique. Depuis 1984,
1951, la loi organisant la statistique                        de nombreux secteurs de la société.         de telles dérogations sont possibles
publique en France 1 comprenait le                            Or, au-delà d’un certain niveau de          sous réserve d’un passage devant un
mot « secret » dans son titre. Dans le                        détail dans les croisements, le secret      comité spécialisé rattaché au
code de bonnes pratiques de la statis-                        statistique ne peut plus être respecté,     Conseil national de l’information
tique européenne publié en 2005, le                           car les « cases de tableaux » révèlent      statistique (Cnis), le comité du secret
secret statistique figure au principe                         en fait des informations individuelles.     statistique. Celui-ci examine le
n° 52. Il convient en effet de pouvoir                        Cette contradiction est devenue parti-      bien-fondé de la demande, évalue la
assurer aux personnes répondant à                             culièrement apparente dans les              nécessité d’avoir recours à des infor-
une enquête que leurs réponses ne                             travaux des chercheurs. La commu-           mations individuelles, juge le
pourront en aucun cas être utilisées                          nauté des chercheurs en sciences            sérieux du demandeur et la capacité
de façon à leur porter préjudice.                             humaines et sociales a depuis long-         de l’organisme auquel il appartient
C’est pourquoi la préservation du se-                         temps fait valoir son besoin d’accéder      et qui soutient sa demande à respec-
cret statistique constitue une disposi-                       à des informations individuelles pour       ter en pratique les contraintes liées
tion majeure de la loi fondamentale                           effectuer des travaux de plus en plus       au respect du secret statistique. En
de la statistique française.                                  complexes. Ces travaux ne nécessi-          cas d’avis positif, le demandeur peut
Pendant longtemps cette exigence                              tent pas, en général, de connaître          avoir accès aux données, après
n’a pas été ressentie comme une forte                         nommément la personne ayant                 signature individuelle par chaque
gêne par les utilisateurs de la statis-                       répondu à l’enquête. Mais les cher-         bénéficiaire d’un engagement à
tique publique. Ceux-ci se conten-                            cheurs ne peuvent plus se contenter         respecter les règles du secret statis-
taient de résultats globaux des                               de disposer de résultats agrégés. Le        tique. Il faut souligner que cette
enquêtes ou de résultats désagrégés                           développement de la théorie et des          possibilité, qui en pratique bénéficie
selon des catégories prédéfinies (acti-                       outils économétriques, conjugué à           à des équipes de recherche et à des
vités, professions, lieux) sans que la                        celui de la puissance des instruments       administrations publiques, ne leur est
diffusion de ces résultats porte                              de calcul ouvre de multiples possibi-       pas réservée par la loi.
atteinte au secret. Cependant, la                             lités fondées sur l’analyse de données
                                                              individuelles, que les chercheurs sont      Dans le cas des « données relatives
                                                              impatients d’explorer.                      aux faits et comportements d’ordre
* Chef du département de la coordination statistique à
l’Insee
                                                                                                          privé» - c’est-à-dire en pratique des
** Chercheur au Crest-Insee                                         Accès à des données                   données sur des personnes ou des
1. Loi n° 51-711 du 7 juin 1951 sur l’obligation, la co-
ordination et le secret en matière de statistiques
                                                                 individuelles : la situation             ménages - la loi de 1951 ne prévoyait
2. « Le respect de la vie privée ou du secret des affaires          entre 1951 et 2008                    à l’origine aucune dérogation et,
des fournisseurs de données (ménages, entreprises, ad-                                                    jusqu’en 2008, aucune communica-
ministrations et autres répondants), la confidentialité des
                                                              Dans le cas de renseignements indivi-       tion de renseignements individuels
informations qu’ils communiquent et l’utilisation de cel-
les-ci à des fins strictement statistiques doivent être ab-   duels relatifs à des « données à carac-     n’était possible. Seule la communica-
solument garantis ».                                          tère économique et financier » -            tion de fichiers anonymisés était licite.


Courrier des statistiques n° 130, mai 2011                                                                                                       1
Le centre d'accès sécurisé aux données de la statistique publique française


Pour répondre à la demande de plus          secret statistique, dont la compétence                          Le recours à un centre
en plus pressante des chercheurs,           a donc été étendue.                                                d’accès sécurisé
l’Insee a créé en 2006 les « fichiers de
production et de recherche » (FPR),         La procédure suppose, après l’avis du                      Depuis 2008, la loi rend donc
fichiers individuels, présentant une        comité du secret statistique, l’accord                     possible la c ommunication d e
observation par individu enquêté,           du service dont émanent les docu-                          données statistiques sur les personnes
mais où l’on a au préalable supprimé        ments avant la décision formelle de                        ou les ménages à des chercheurs.
toutes les variables permettant l’identi-   communication par la direction des                         Mais l’impératif de protection des
fication directe ou indirecte des           archives. Pour ce qui le concerne,                         répondants continue à s’imposer à
personnes : nom, adresse, profession        l’Insee a informé le comité du secret                      tous, et particulièrement aux institu-
et nationalité détaillées, identification   statistique, lors de sa séance du                          tions statistiques. C’est pourquoi
de l’employeur pour les salariés, etc.      6 octobre 2009, des conditions qu’il                       l’Insee a choisi de recourir à un
Ces FPR sont mis à la disposition des       mettrait pour donner cet accord :                          « centre d’accès sécurisé » pour
chercheurs via le réseau Quetelet,                                                                     mettre en œuvre les nouvelles dispo-
avec lequel l’Insee a signé une             - pour les services statistiques minis-                    sitions permises par la loi.
convention précisant les modalités de       tériels (SSM), qui ont dans leur
mise en œuvre du dispositif. Cette          mission de gérer des dossiers couverts                     Qu’est-ce qu’un centre d’accès sécu-
disposition a permis de satisfaire un       par le secret statistique, les fichiers                    risé ? C’est un dispositif technique
grand nombre de demandes des cher-          seront transmis sous réserve de la                         permettant à des utilisateurs autorisés
cheurs pour l’accès à des données           production par eux d’un document                           de travailler sur des données confi-
individuelles, et elle reste d’une          attestant qu’ils se sont bien dotés des                    dentielles tout en s’assurant que ces
grande utilité.                             moyens pour faire respecter le secret                      données ne risquent pas d’être
                                            statistique et que leur équipement                         détournées pour d’autres fins, acci-
Cependant, il existe un ensemble de         informatique présente bien l’étan-                         dentellement ou intentionnellement.
demandes, légitimes du point de vue         chéité suffisante par rapport à celui                      En matière de données statistiques, la
scientifique, qui ne peuvent trouver        du reste du ministère ;                                    création des premiers centres d’accès
leur satisfaction dans la mise à dispo-                                                                sécurisés destinés à la recherche
                                            - pour les autres demandeurs, l’accès
sition des FPR. Ce sont les projets de                                                                 remonte aux années 1990 aux USA et
                                            aux données se fera par le biais d’un
recherche qui nécessitent un détail                                                                    au Canada. En Europe, des pays du
                                            centre d’accès sécurisé ;
géographique, par nationalité ou par                                                                   Nord (Danemark, Pays-Bas) ont créé
profession non disponible dans les          - dans ces deux cas, les fichiers auront                   de tels centres au début des années
FPR3, ou qui font appel à un apparie-       été, si nécessaire, transformés pour                       2000. Ils ont été rejoints par la
ment avec d’autres fichiers, par            perdre leur caractère directement                          Grande-Bretagne, puis l’Allemagne,
                                                                                                                                     6
exemple en couplant, grâce à l’identi-      nominatif ; c’est-à-dire qu’on y aura                      au milieu de cette décennie .
fiant de l’employeur, des caractéristi-     retiré, le cas échéant, le nom du
ques de l’enquêté et de l’entreprise        répondant et le NIR (numéro d’ins-                         Les premiers centres d’accès sécuri-
dans laquelle il travaille. L’accès à ces   cription au répertoire - le numéro de                      sés à des données statistiques ont été
informations rompt nécessairement           la Sécurité sociale) ;                                     des centres « physiques »,
l’anonymat et était, de ce fait, impos-                                                                c’est-à-dire des locaux gérés par
                                            - pour les demandes d’accès à des
sible jusqu’en 2008.                                                                                   une institution statistique (éventuel-
                                            documents directement nominatifs,
                                                                                                       lement à l’intérieur d’une universi-
                                            l’accord ne pourrait être donné que
                                                                                                       té, comme au Canada) et contenant
                                            dans le cas de la constitution d’un
    Les évolutions issues de                                                                           un serveur de données. Dans ces
                                            échantillon pour une enquête de la
   la loi de 2008 concernant                                                                           locaux, l’institution statistique
                                            statistique publique ayant obtenu un
 les données sur les ménages                                                                           donne au demandeur un accès
                                            visa5 sous réserve de l’accord expli-
                                                                                                       physique directement sur le serveur.
                                            cite, au cas par cas, du comité de
En 2008, la modification de la loi                                                                     Cela implique que le demandeur se
                                            direction de l’Insee.
statistique de 1951 par un article de la                                                               déplace pour travailler en dehors de
                    4
loi sur les archives a ouvert la possi-                                                                son environnement habituel. Cette
bilité d’accéder à des renseignements                                                                  solution exige aussi l’aménagement
                                            3. Afin de rendre les FPR totalement anonymes, certai-
indiv idue ls re la tifs a u x fa its e t   nes variables géographiques, sur la nationalité ou la      de locaux spécifiques (éventuelle-
comportements d’ordre privé sous            profession sont supprimées (code commune) ou re-           ment en plusieurs points du terri-
                                            groupées en un petit nombre de modalités.
deux conditions :                           4. Loi n°2008-696 du 15 juillet 2008 relative aux ar-
                                                                                                       toire) matériellement sécurisés
                                            chives, article 2                                          (portes, fenêtres) dont la surveil-
- l’une liée à la finalité : cette commu-   5. Ce visa est attribué par le ministre chargé de          lance est confiée à une personne
nication n’est possible qu’à des fins       l’économie et le ministre à la compétence duquel res-
                                            sortissent les intéressés.                                 assermentée. C’est la solution
de statistique publique ou de
                                            6. Pour un panorama, on pourra consulter dans le           retenue au Canada et en Allemagne.
recherche scientifique ou historique ;      Courrier des statistiques n°121-122 de décembre
                                                                                                       Elle est très coûteuse, aussi bien
                                            2007 : « L’accès aux micro-données et la gestion de la
- l’autre liée à la procédure : celle-ci    confidentialité dans quelques INS européens » par          pour l’Institut de statistique que
exige en effet un avis du comité du         Dominique Rouault.                                         pour les chercheurs.


2                                                                                                    Courrier des statistiques n° 130, mai 2011
Jean-Pierre le Gléau et Jean-François Royer


Grâce aux progrès de l’informatique,         d’économie et statistique, établisse-        chercheur qui estime qu’il ne peut
on a vu apparaître depuis 2005 des           ment public qui était jusqu’à fin 2010       pas s’en contenter et qu’il a besoin
« centres d’accès sécurisés distants »       une direction de l’Insee). Elle consiste     des fichiers complets doit à ce stade
(CASD) n’imposant plus aux cher-             à mettre à disposition de l’organisme        bien préciser pourquoi certaines
cheurs de se déplacer dans un endroit        demandeur, un terminal appelé « SD           variables lui manquent encore :
particulier. Ce sont des systèmes            Box » pour lui permettre de se               c’est l’information cruciale qu’il
informatiques dans lesquels les              connecter et de travailler sur le            devra fournir au comité du secret
données restent stockées sur un              serveur installé au Genes. Cette « SD        statistique. Pour cette phase d’éla-
serveur unique, géré par l’institution       Box » permet au chercheur de voir            boration, le chercheur devra impé-
statistique, mais sur lequel les cher-       les données sur lesquelles il travaille,     rativement prendre contact avec le
cheurs peuvent travailler à distance,        de les intégrer dans ses calculs et d’en     service producteur, de façon à bien
sans risque de dissémination. Il peut        tirer des tableaux, graphiques, analy-       cerner sa demande et à vérifier qu’il
s’agir seulement de pouvoir                  ses. Mais à aucun moment il ne peut          a pris connaissance de tous les
soumettre des travaux à distance             ni les imprimer, ni les enregistrer sur      fichiers auxquels il peut avoir
(« remote submission »), les résultats       un support quelconque : clef USB,            accès, de leurs possibilités et aussi
étant récupérés de façon différée ; ou       CD Rom... Ainsi, les données ne quit-        de leurs limites.
bien il peut s’agir d’un véritable accès     tent jamais le serveur du Genes. La
« en ligne » (« remote access »)             c o m m u n ic a tio n e n tr e c e tte      Le chercheur présente ensuite sa
permettant au chercheur une forte            « SD Box » et le serveur est assurée         demande au comité du secret statis-
interactivité avec les données. Dans         par une liaison sécurisée et cryptée.        tique : le secrétariat du comité
ce dernier cas, le chercheur distant                                                      (comite-secret@cnis.fr) peut lui fournir
travaille réellement « sur le serveur »      Cette solution a commencé à fonc-            toutes les indications nécessaires. Le
de l’institution statistique, mais le        tionner début 2010, et à ce jour une         comité du secret statistique se réunit
logiciel de sécurisation des données         trentaine de projets de recherche en         une fois par trimestre et donne un avis ;
l’empêche de les exporter.                   bénéficient. Les deux paragraphes qui        il opère comme cela a été décrit précé-
                                             suivent décrivent plus en détail le          demment pour les données sur les
                                             cheminement d’un projet de                   entreprises. S’ajoutent cependant,
       La solution retenue                   recherche qui a recours à ce dispositif.     dans les critères à prendre en compte,
           par l’Insee                                                                    ceux de la finalité du traitement qui ne
                                                                                          peut être, pour les données sur les
                                              Phase préparatoire : connaître
Pour les demandeurs autres que les                                                        ménages, que la statistique publique
                                                   les données, explorer
SSM, l’Insee a donc choisi la solution du                                                 ou la recherche scientifique ou histo-
                                                les moyens d’accès, faire
passage par un centre d’accès sécurisé                                                    rique. La présence du chercheur à la
                                              les formalités administratives
distant en « remote access », où les                                                      séance du comité est nécessaire pour
données, les métadonnées et les              Concrètement, un chercheur qui               que ses membres puissent recevoir les
programmes d’utilisation restent donc        souhaite accéder à des données indi-         éclaircissements et les assurances
sur un serveur central unique géré par       viduelles sur les ménages produites          nécessaires.
l’institution statistique ou sous son        par l’Insee ou par un SSM doit tout
contrôle. Techniquement, cette solution      d’abord prendre connaissance de la           En cas d’avis favorable du comité du
aurait pu être mise en œuvre en instal-      source statistique dont ces données          secret statistique, le chercheur peut
lant un logiciel gérant la confidentialité   peuvent être tirées, et des différents       consulter les données sur le centre
(interdisant entre autres toute recopie ou   produits de diffusion de cette source.       d’accès sécurisé distant. Un certain
impression des données examinées) sur        Pour cela, ce chercheur dispose de           délai est cependant nécessaire pour
chaque poste de demandeur. C’est la          deux ressources documentaires prin-          d’une part mettre en place les
solution retenue aux Pays-Bas. Elle          cipales : le site Internet de l’Insee        données que le chercheur est autorisé
implique une adaptation de ce logiciel à     (www.insee.fr) (ou celui du SSM),            à traiter, d’autre part accomplir les
chaque configuration des ordinateurs ;       riche en informations générales sur la       formalités requises par la Commis-
elle doit être modifiée lorsque cette        source, en données agrégées et qui           sion nationale de l’informatique et
configuration change.                        met à disposition un fichier individuel      des libertés (Cnil).
                                             anonymisé d’usage public s’il a été
L a solution r e te nue pa r l’Inse e        possible d’en établir un ; le site Inter-    Les données disponibles sur le CASD
présente les mêmes fonctionnalités,          net     du      réseau       Q u e te le t   sont aujourd’hui celles auxquelles
mais a l’avantage de n’impliquer             (www.reseau-quetelet.cnrs.fr) qui            donne accès le comité du secret
aucune intervention dans le système          donne accès à un dessin de fichier, et       statistique, dans sa formation « ména-
informatique des établissements de           au « FPR » s’il en existe un.                ges ». Il s’agit donc d’enquêtes statis-
recherche. Elle a été mise au point et                                                    tiques auprès des ménages, récentes
brevetée par l’équipe « Organisation         Beaucoup de recherches, on l’a dit,          ou plus anciennes, y compris le
du système d’information » du Genes          peuvent être conduites avec ces              recensement de la population. Mais il
(Groupe des écoles nationales                matériaux d’accès aisé et rapide. Le         s’agit      aussi      de    données



Courrier des statistiques n° 130, mai 2011                                                                                       3
Le centre d'accès sécurisé aux données de la statistique publique française


administratives déjà mises à la dispo-                       Phase active : la formation,                une « boîte aux lettres » virtuelle à
sition de l’Insee ou des SSM au titre de                      et le travail sur le CASD                  laquelle il a accès. Ce fichier est
           bis                 7
l’article 7 de la loi de 1951 . À titre                                                                  examiné par des personnes habilitées
d’exemple, les déclarations annuel-                         Dans les semaines qui suivent son            au secret statistique. Elles s’assurent
les de données sociales (DADS) figu-                        autorisation à accéder à certaines           que le fichier ne contient pas d’élé-
rent dans cette catégorie. D’autres                         données confidentielles, le chercheur        ments pouvant constituer une rupture
données peuvent également être                              est invité par les gestionnaires du          du secret statistique. Si tel est le cas,
introduites dans l’espace réservé au                        CASD à participer à une séance dite          elles avertissent le chercheur et lui
projet du chercheur sur le CASD, si                         « d’enrôlement », au cours de                demandent de rectifier son fichier de
leur utilisation est nécessaire dans le                     laquelle lui sont rappelés les princi-       sortie, afin qu’il soit conforme aux
cadre de l’étude pour laquelle il a                         pes généraux du secret statistique, la       règles de la confidentialité. S’il ne
demandé l’accès aux informations                            responsabilité personnelle qui lui           comporte aucun élément de nature à
confidentielles. Il peut s’agir par                         sera confiée et les modalités pratiques      dévoiler une information confiden-
exemple de données apportées par le                         d’accès au centre. Ces dernières             tielle, il est renvoyé, par simple
chercheur lui-même ; elles sont alors                       consistent en :                              messagerie, au chercheur.
introduites sur le CASD par un agent
                                                            - l’attribution d’une « SD Box », si
habilité à la gestion du centre.                                                                         Aujourd’hui, cette vérification est
                                                            l’organisme dont il dépend n’en est
                                                                                                         exhaustive sur tous les fichiers de
                                                            pas encore pourvue ;
Comme on l’a vu plus haut, avant de                                                                      résultats produits dans le CASD dont
se connecter, le chercheur doit égale-                      - l’attribution d’une carte individuelle     un chercheur demande la sortie. C’est
ment avoir accompli les formalités                          de connexion contenant un code               une solution coûteuse, car elle
nécessaires auprès de la Cnil : en                          obtenu par traitement de ses emprein-        demande une grande expertise de la
général une simple déclaration (pour                        tes digitales, relevées au cours de          part des personnes habilitées. Son
les fichiers ne comportant pas de                           cette séance.                                coût augmentera avec celui de la
données sensibles), exceptionnelle-                                                                      fréquentation du centre. Si le nombre
ment, une demande d’autorisation.                           Le chercheur peut avoir accès aux            de personnes habilitées qui se consa-
De son côté, l’Insee effectue progres-                      fichiers qu’il a demandés, sur la « SD       crent à ce contrôle était insuffisant,
sivement toutes les formalités auprès                       Box » qui lui a été attribuée. La recon-     cela pourrait de plus entraîner des
de la Cnil pour déclarer cette                              naissance de son identité se fait grâce      retards dans le feu vert donné aux
nouvelle forme de diffusion de                              à sa carte et à la reconnaissance de         chercheurs. C’est pourquoi on pour-
données à caractère personnel. Il                           ses empreintes digitales par le lecteur      rait envisager à l’avenir de n’effectuer
s’agit de modifier toutes les déclara-                      intégré à la SD Box. Il faut noter que       cette vérification que par sondage.
tions (ou demandes d’autorisation)                          ce dispositif ne comporte aucun stoc-        Dans tous les cas, la responsabilité de
effectuées par l’Insee pour les sources                     kage des empreintes digitales ailleurs       la rupture du secret statistique reste
statistiques depuis la création de la                       que sur la carte qui reste en posses-        de la responsabilité de celui qui aurait
Cnil (1978). Ce processus est long et                       sion du chercheur.                           produit le fichier fautif. L’absence
plusieurs mois seront encore néces-                                                                      d’un contrôle exhaustif pourrait
saires avant que toutes les sources                         Plusieurs chercheurs peuvent être            mettre en avant ce point et rappeler le
concernées aient été traitées. Il se                        inscrits sur un même projet : le dossier     chercheur à sa responsabilité person-
peut donc que l’accès à certains                            présenté au comité du secret statis-         nelle, alors qu’un contrôle exhaustif
fichiers soit temporairement retardé,                       tique mentionne en ce cas les noms           peut lui donner l’illusion (fausse) qu’il
le temps que ces formalités se fassent.                     de tous les chercheurs associés à ce         est « couvert » par la vérification
Pour diminuer au maximum l’impact                           projet. Ceux-ci ont alors accès à un         effectuée par un tiers.
sur les utilisateurs du CASD, l’Insee                       espace spécifique sur le CASD, dédié
commence évidemment en priorité                             à leur projet. Le gestionnaire du            Lorsque le chercheur a mené ses
par les fichiers les plus demandés sur                      centre y installe les bases de données       travaux jusqu’au bout, ce qui doit
celui-ci.                                                   qui leur sont spécifiques, et leur ouvre     intervenir avant l’expiration de son
                                                            l’accès aux fichiers de l’Insee ou des       habilitation, il en avertit les
                                                            SSM pour lesquels l’autorisation d’ac-       gestionnaires du CASD. Son accès
                                                            cès leur a été donnée. Personne              au CASD est alors coupé. Cepen-
                                                            d’autre qu’eux n’a accès à cet espace.       d a n t, so n e s p a c e d e tr a v a il e s t
                                                            Ils peuvent également utiliser la large      archivé pour une durée de trois ans
                                                            gamme de logiciels de calcul statis-         renouvelable une fois. Cette dispo-
                                                            tique et d’édition mis à la disposition      sition rend possibles les éventuels
7. « Sur demande du ministre chargé de l’économie,          de tous les chercheurs sur le CASD.          « retours vers les données », néces-
après avis du Conseil national de l’information statis-
tique, et sauf disposition législative contraire, les in-
                                                                                                         saires après une publication par
formations (...) recueillies dans le cadre de sa            Lorsque le chercheur a terminé un            exemple. Au terme de cette
mission, par (...) une personne morale de droit public      travail sur les données, il crée un          période, tous les fichiers propres au
(...) sont cédées, à des fins exclusives d’établissement
de statistiques, à l’Insee ou aux services statistiques
                                                            fichier de résultats (tableaux, projet       chercheur et présents sur le CASD
ministériels. »                                             de publication,...) qu’il glisse dans        seront détruits.


4                                                                                                      Courrier des statistiques n° 130, mai 2011
Jean-Pierre le Gléau et Jean-François Royer


 Vers une collaboration accrue                          Le cas des appariements                    individuelles sur les entreprises.
entre chercheurs et statisticiens                                                                  Lorsqu’un chercheur a aujourd’hui
                                                    Les chercheurs ont fréquemment                 accès à ces données, suite à un avis
L’accès à des données individuelles de              besoin d’effectuer des appariements            du comité du secret statistique, il
sources statistiques pour mener des                 de données, pour enrichir les informa-         obtient ces données sur un CD crypté
recherches est une nécessité pour la                tions recueillies lors d’une enquête,          qu’il doit conserver pendant un
plupart des chercheurs contempo-                    par des données administratives, ou            temps dans des conditions de sécuri-
rains. Un premier résultat des progrès              issues d’une autre enquête. Cet appa-          té garantissant la confidentialité des
récents pour faciliter cet accès - FPR,             riement se fait souvent sur un numéro          données, puis détruire. On conçoit
CASD - doit être une plus grande                    d’identification (par exemple le NIR           facilement que le CASD apportera
présence et visibilité des données fran-            pour les personnes physiques et le             des garanties plus solides de ce point
çaises dans des recherches de niveau                numéro Sirène pour les personnes               de vue.
international, qu’elles soient menées               morales). Dans certains cas, le cher-
par des chercheurs français ou par des              cheur pourra mener lui-même cet                En 2010, l’accès au CASD était gratuit.
chercheurs étrangers habilités. Il faut             appariement à l’intérieur du CASD.             En effet certains aspects liés à la mise
préciser en effet que ni la loi, ni la              Dans d’autres cas, ce ne sera pas              en route (disponibilité des fichiers,
pratique administrative n’interdisent               possible, en particulier si c’est le NIR       déclaration à la Cnil,...) ont parfois
la communication de ces données à                   qui est en jeu. Ce numéro, on l’a vu,          retardé la mise en œuvre du service
des chercheurs étrangers : ceux-ci                  est retiré, s’il existait dans le fichier      pour les chercheurs, et il aurait pu
peuvent parfaitement s’engager dans                 initial, au moment de la mise sur le           paraître anormal de facturer un service
le processus de demande décrit plus                 CASD. Si un appariement non faisable           qui n’avait pas encore atteint la qualité
haut. Et le système informatique                    dans le CASD est cependant néces-              voulue. Il est clair cependant que,
permet d’installer des « SD Box » en                saire, et est autorisé par la Cnil, le cher-   au-delà de l’investissement initial, le
tout lieu. Cependant, l’autorisation ne             cheur peut demander à l’Insee de               fonctionnement du CASD représente
pourra être donnée que si les cher-                 réaliser cet appariement hors du               une charge pour l’institution qui en a
cheurs concernés donnent toutes les                 CASD et de mettre le fichier issu de           la gestion : gestion des demandes,
garanties nécessaires, y compris sur le             l’appariement (sans les numéros                récupération des fichiers, parfois
plan juridique, en ce qui concerne la               d’identification) sur le CASD. Il s’agit       anciens, documentation, mise en
sanction des ruptures éventuelles du                là bien évidemment d’une prestation            ligne, formalités Cnil, attribution
secret statistique.                                 spécifique, qui ne peut se faire qu’a-         d’une « SD Box », licences pour les
                                                    vec l’accord du gestionnaire du CASD           logiciels, vérification des sorties, etc. À
Un deuxième résultat de ces progrès                 et moyennant une facturation du                l’avenir, l’accès au CASD devra donc
sera une intensification de la colla-               service. Le fichier apparié restera sur le     couvrir les frais entraînés par ces acti-
boration entre statisticiens publics                CASD, sans possibilité pour le cher-           vités. À ce jour, ni les modalités, ni le
et chercheurs autour des sources                    cheur de le sortir, ni d’en tirer des          niveau de cette tarification n’ont
statistiques. Déjà, des formations                  résultats qui ne respecteraient pas les        encore été complètement définis.
« sources » sont organisées à l’Insee               règles du secret statistique. Ce travail
pour les chercheurs bénéficiaires                   peut aussi bien être effectué sur des          Le CASD a été créé à l’Insee, au sein
des autorisations : elles sont l’occa-              fichiers disponibles sur le centre, qu’a-      du Genes, qui en était une compo-
sion d’échanges fructueux. Certai-                  vec un ou des fichiers apportés par le         sante. Depuis le 1er janvier 2011, le
nes difficultés rencontrées par les                 chercheur, comme résultats d’une               Genes est devenu un établissement
c h e r c h e u r s e n c o u r s d e tr a v a il   enquête qu’il a lui-même effectuée.            public d’enseignement supérieur et de
devront être résolues en faisant                                                                   recherche, distinct de l’Insee. En ce
appel aux producteurs, ce qui                                                                      qui concerne le CASD, cela a entraî-
devrait enrichir la documenta-                               L’avenir du CASD                      né le transfert au Genes de tâches
tion...et dans certains cas permettre                                                              incombant auparavant à l’Insee :
de corriger des erreurs. Au fur et à                Aujourd’hui, les capacités du CASD             habilitation des gestionnaires, trans-
mesure que des recherches utilisant                 sont encore contraintes par les limites        fert des fichiers, opérations de vérifica-
des données individuelles se                        en matériel et en personnel qualifié           tion en sortie, etc. Le Genes définira,
termineront, on attend des cher-                    nécessaire à son fonctionnement.               en son sein, une structure spécifique
cheurs des « retours sur les sources » :            Après une inévitable période de                de gouvernance pour le CASD. Ces
appréciations, critiques, suggestions,              rodage, on pourra envisager d’élargir          modifications d’ordre administratif
etc. Comme beaucoup de ces sources                  encore les missions qui lui sont attri-        n’ont pas eu de conséquences sur l’ac-
sont renouvelées périodiquement, ce                 buées, par exemple en se reposant sur          cès au CASD par les chercheurs, pour
processus peut contribuer fortement à               lui également pour la mise à disposi-          lesquels cette évolution a été « trans-
leur amélioration progressive.                      tion de fichiers de données                    parente ». n




Courrier des statistiques n° 130, mai 2011                                                                                                  5

Weitere ähnliche Inhalte

Was ist angesagt?

Protection des données personnelles - Online Economy Conference - 14 décembre...
Protection des données personnelles - Online Economy Conference - 14 décembre...Protection des données personnelles - Online Economy Conference - 14 décembre...
Protection des données personnelles - Online Economy Conference - 14 décembre...aclorrain
 
Comment concevoir son référentiel protection de la vie privée et avec quelle ...
Comment concevoir son référentiel protection de la vie privée et avec quelle ...Comment concevoir son référentiel protection de la vie privée et avec quelle ...
Comment concevoir son référentiel protection de la vie privée et avec quelle ...Denis VIROLE
 
Charte du droit à l'oubli numérique
Charte du droit à l'oubli numériqueCharte du droit à l'oubli numérique
Charte du droit à l'oubli numériquenathanseronet
 
Politiques de protection de la vie privee et sécurité système d'information
Politiques de protection de la  vie privee et sécurité système d'informationPolitiques de protection de la  vie privee et sécurité système d'information
Politiques de protection de la vie privee et sécurité système d'informationDenis VIROLE
 
Plan d'action GDPR Luxembourg Ageris Halian
Plan d'action GDPR Luxembourg Ageris HalianPlan d'action GDPR Luxembourg Ageris Halian
Plan d'action GDPR Luxembourg Ageris HalianDenis VIROLE
 
SÉCURITÉ DES DONNÉES & RGPD
SÉCURITÉ DES DONNÉES & RGPDSÉCURITÉ DES DONNÉES & RGPD
SÉCURITÉ DES DONNÉES & RGPDTelecomValley
 
Cnil - Guide Travail
Cnil - Guide TravailCnil - Guide Travail
Cnil - Guide Travailfoxshare
 

Was ist angesagt? (7)

Protection des données personnelles - Online Economy Conference - 14 décembre...
Protection des données personnelles - Online Economy Conference - 14 décembre...Protection des données personnelles - Online Economy Conference - 14 décembre...
Protection des données personnelles - Online Economy Conference - 14 décembre...
 
Comment concevoir son référentiel protection de la vie privée et avec quelle ...
Comment concevoir son référentiel protection de la vie privée et avec quelle ...Comment concevoir son référentiel protection de la vie privée et avec quelle ...
Comment concevoir son référentiel protection de la vie privée et avec quelle ...
 
Charte du droit à l'oubli numérique
Charte du droit à l'oubli numériqueCharte du droit à l'oubli numérique
Charte du droit à l'oubli numérique
 
Politiques de protection de la vie privee et sécurité système d'information
Politiques de protection de la  vie privee et sécurité système d'informationPolitiques de protection de la  vie privee et sécurité système d'information
Politiques de protection de la vie privee et sécurité système d'information
 
Plan d'action GDPR Luxembourg Ageris Halian
Plan d'action GDPR Luxembourg Ageris HalianPlan d'action GDPR Luxembourg Ageris Halian
Plan d'action GDPR Luxembourg Ageris Halian
 
SÉCURITÉ DES DONNÉES & RGPD
SÉCURITÉ DES DONNÉES & RGPDSÉCURITÉ DES DONNÉES & RGPD
SÉCURITÉ DES DONNÉES & RGPD
 
Cnil - Guide Travail
Cnil - Guide TravailCnil - Guide Travail
Cnil - Guide Travail
 

Andere mochten auch

Fusion des régions : dossier spécial dans Juramag
Fusion des régions : dossier spécial dans JuramagFusion des régions : dossier spécial dans Juramag
Fusion des régions : dossier spécial dans JuramagDépartement du Jura
 
Acebo (adrián a y álvaro)
Acebo (adrián a y álvaro)Acebo (adrián a y álvaro)
Acebo (adrián a y álvaro)cp blan
 
Owf 2013 rii intro moreau
Owf 2013 rii intro moreauOwf 2013 rii intro moreau
Owf 2013 rii intro moreauPatrick MOREAU
 
Webinar: Cómo mantener una base de datos saludable
Webinar: Cómo mantener una base de datos saludableWebinar: Cómo mantener una base de datos saludable
Webinar: Cómo mantener una base de datos saludableMasterBase®
 
Partenariat et cobranding pour innover dans vos PME
Partenariat et cobranding pour innover dans vos PMEPartenariat et cobranding pour innover dans vos PME
Partenariat et cobranding pour innover dans vos PMEFrederic BERNIER
 
Estudio de marketing MasterBase noviembre 2014
Estudio de marketing MasterBase noviembre 2014Estudio de marketing MasterBase noviembre 2014
Estudio de marketing MasterBase noviembre 2014MasterBase®
 
Animaux exotiques-geants
Animaux exotiques-geantsAnimaux exotiques-geants
Animaux exotiques-geantsSaqqarah 31
 
No Se Turbe Vuestro CorazóN
No Se Turbe Vuestro CorazóNNo Se Turbe Vuestro CorazóN
No Se Turbe Vuestro CorazóNIRMA CHAVEZ
 
Analisis de-vida-1198901411382483-5
Analisis de-vida-1198901411382483-5Analisis de-vida-1198901411382483-5
Analisis de-vida-1198901411382483-5IRMA CHAVEZ
 
Weekly actions 10 decembre 2010
Weekly actions 10 decembre 2010Weekly actions 10 decembre 2010
Weekly actions 10 decembre 2010Cherradi -
 
Le credit à la consommation en Europe (fin 2009)
Le credit à la consommation en Europe (fin 2009)Le credit à la consommation en Europe (fin 2009)
Le credit à la consommation en Europe (fin 2009)CA Consumer Finance
 
Solution qebsys v10-10-26
Solution qebsys v10-10-26Solution qebsys v10-10-26
Solution qebsys v10-10-26Patrickkk
 
Agile With Guts, Agile Tour Montpellier 2013, Lean-Design, Value Driven Devel...
Agile With Guts, Agile Tour Montpellier 2013, Lean-Design, Value Driven Devel...Agile With Guts, Agile Tour Montpellier 2013, Lean-Design, Value Driven Devel...
Agile With Guts, Agile Tour Montpellier 2013, Lean-Design, Value Driven Devel...Laurent Carbonnaux
 

Andere mochten auch (20)

Fusion des régions : dossier spécial dans Juramag
Fusion des régions : dossier spécial dans JuramagFusion des régions : dossier spécial dans Juramag
Fusion des régions : dossier spécial dans Juramag
 
Acebo (adrián a y álvaro)
Acebo (adrián a y álvaro)Acebo (adrián a y álvaro)
Acebo (adrián a y álvaro)
 
Owf 2013 rii intro moreau
Owf 2013 rii intro moreauOwf 2013 rii intro moreau
Owf 2013 rii intro moreau
 
Presentación Proyecto UAPresencia
Presentación Proyecto UAPresenciaPresentación Proyecto UAPresencia
Presentación Proyecto UAPresencia
 
Webinar: Cómo mantener una base de datos saludable
Webinar: Cómo mantener una base de datos saludableWebinar: Cómo mantener una base de datos saludable
Webinar: Cómo mantener una base de datos saludable
 
Partenariat et cobranding pour innover dans vos PME
Partenariat et cobranding pour innover dans vos PMEPartenariat et cobranding pour innover dans vos PME
Partenariat et cobranding pour innover dans vos PME
 
Estudio de marketing MasterBase noviembre 2014
Estudio de marketing MasterBase noviembre 2014Estudio de marketing MasterBase noviembre 2014
Estudio de marketing MasterBase noviembre 2014
 
Animaux exotiques-geants
Animaux exotiques-geantsAnimaux exotiques-geants
Animaux exotiques-geants
 
Grupo c2 elementos de la fase de analisis
Grupo c2 elementos de la fase de analisisGrupo c2 elementos de la fase de analisis
Grupo c2 elementos de la fase de analisis
 
Aa51
Aa51Aa51
Aa51
 
Xalapa
XalapaXalapa
Xalapa
 
No Se Turbe Vuestro CorazóN
No Se Turbe Vuestro CorazóNNo Se Turbe Vuestro CorazóN
No Se Turbe Vuestro CorazóN
 
Analisis de-vida-1198901411382483-5
Analisis de-vida-1198901411382483-5Analisis de-vida-1198901411382483-5
Analisis de-vida-1198901411382483-5
 
Weekly actions 10 decembre 2010
Weekly actions 10 decembre 2010Weekly actions 10 decembre 2010
Weekly actions 10 decembre 2010
 
Le credit à la consommation en Europe (fin 2009)
Le credit à la consommation en Europe (fin 2009)Le credit à la consommation en Europe (fin 2009)
Le credit à la consommation en Europe (fin 2009)
 
Presentación acogida 2014
Presentación acogida 2014Presentación acogida 2014
Presentación acogida 2014
 
Reseña nucleo
Reseña nucleoReseña nucleo
Reseña nucleo
 
Solution qebsys v10-10-26
Solution qebsys v10-10-26Solution qebsys v10-10-26
Solution qebsys v10-10-26
 
Sylos conférence_Foro Gaston Piatan et Youssoufa Hassana
Sylos conférence_Foro Gaston Piatan et Youssoufa Hassana Sylos conférence_Foro Gaston Piatan et Youssoufa Hassana
Sylos conférence_Foro Gaston Piatan et Youssoufa Hassana
 
Agile With Guts, Agile Tour Montpellier 2013, Lean-Design, Value Driven Devel...
Agile With Guts, Agile Tour Montpellier 2013, Lean-Design, Value Driven Devel...Agile With Guts, Agile Tour Montpellier 2013, Lean-Design, Value Driven Devel...
Agile With Guts, Agile Tour Montpellier 2013, Lean-Design, Value Driven Devel...
 

Ähnlich wie CASD -données statistique publique française insee mai 2011 (http://www.insee.fr/fr/ffc/docs_ffc/cs130e.pdf)

Confidentialité des données michel béra
Confidentialité des données   michel béraConfidentialité des données   michel béra
Confidentialité des données michel béraKezhan SHI
 
TLM n° 103 Les enjeux de l'open data en santé
TLM n° 103 Les enjeux de l'open data en santéTLM n° 103 Les enjeux de l'open data en santé
TLM n° 103 Les enjeux de l'open data en santéTLM
 
Perspectives sur le droit des donnees
Perspectives sur le droit des donneesPerspectives sur le droit des donnees
Perspectives sur le droit des donneesEdouard DEBERDT
 
Force probante 05102018
Force probante 05102018Force probante 05102018
Force probante 05102018AssociationAF
 
Journée d'étude (02.10) - La justice et la protection des données à caractère...
Journée d'étude (02.10) - La justice et la protection des données à caractère...Journée d'étude (02.10) - La justice et la protection des données à caractère...
Journée d'étude (02.10) - La justice et la protection des données à caractère...EdPoliteia
 
Les mégadonnées dans la recherche
Les mégadonnées dans la rechercheLes mégadonnées dans la recherche
Les mégadonnées dans la rechercheNicolae Sfetcu
 
Cybersécurité & protection des données personnelles
Cybersécurité & protection des données personnellesCybersécurité & protection des données personnelles
Cybersécurité & protection des données personnellesMohamed MDELLA
 
De la protection des données personnelles à la sécurisation des données conne...
De la protection des données personnelles à la sécurisation des données conne...De la protection des données personnelles à la sécurisation des données conne...
De la protection des données personnelles à la sécurisation des données conne...Michel Jaccard
 
Fiche pratique CCI France Règlement Général sur la Protection des Données RGPD
Fiche pratique CCI France Règlement Général sur la Protection des Données RGPDFiche pratique CCI France Règlement Général sur la Protection des Données RGPD
Fiche pratique CCI France Règlement Général sur la Protection des Données RGPDpolenumerique33
 
Ophélie popille ouverture des données publiques à nantes
Ophélie popille   ouverture des données publiques à nantesOphélie popille   ouverture des données publiques à nantes
Ophélie popille ouverture des données publiques à nantesliberTIC
 
2016-10-13 JNI - "Le cadre juridique de la santé numérique"
2016-10-13 JNI - "Le cadre juridique de la santé numérique"2016-10-13 JNI - "Le cadre juridique de la santé numérique"
2016-10-13 JNI - "Le cadre juridique de la santé numérique"ASIP Santé
 
Sensibilisation Open Data
Sensibilisation Open DataSensibilisation Open Data
Sensibilisation Open DataliberTIC
 
Sensibilisation open-data 2017
Sensibilisation open-data 2017Sensibilisation open-data 2017
Sensibilisation open-data 2017Claire Gallon
 
GDPR Pseudonymization (French paper)
GDPR Pseudonymization (French paper)GDPR Pseudonymization (French paper)
GDPR Pseudonymization (French paper)Didier Barella
 
Miettes de données - Keynote BDA 2015
Miettes de données - Keynote BDA 2015Miettes de données - Keynote BDA 2015
Miettes de données - Keynote BDA 2015Amélie Marian
 
Données personnelles et vie privée : ce qui va changer avec le RGPD
Données personnelles et vie privée : ce qui va changer avec le RGPDDonnées personnelles et vie privée : ce qui va changer avec le RGPD
Données personnelles et vie privée : ce qui va changer avec le RGPDCalimaq S.I.Lex
 

Ähnlich wie CASD -données statistique publique française insee mai 2011 (http://www.insee.fr/fr/ffc/docs_ffc/cs130e.pdf) (20)

Confidentialité des données michel béra
Confidentialité des données   michel béraConfidentialité des données   michel béra
Confidentialité des données michel béra
 
TLM n° 103 Les enjeux de l'open data en santé
TLM n° 103 Les enjeux de l'open data en santéTLM n° 103 Les enjeux de l'open data en santé
TLM n° 103 Les enjeux de l'open data en santé
 
Vie privée et RH
Vie privée et RHVie privée et RH
Vie privée et RH
 
Perspectives sur le droit des donnees
Perspectives sur le droit des donneesPerspectives sur le droit des donnees
Perspectives sur le droit des donnees
 
Force probante 05102018
Force probante 05102018Force probante 05102018
Force probante 05102018
 
Marketing digital et données personnelles
Marketing digital et données personnellesMarketing digital et données personnelles
Marketing digital et données personnelles
 
vie privée en 2013
vie privée en 2013  vie privée en 2013
vie privée en 2013
 
Journée d'étude (02.10) - La justice et la protection des données à caractère...
Journée d'étude (02.10) - La justice et la protection des données à caractère...Journée d'étude (02.10) - La justice et la protection des données à caractère...
Journée d'étude (02.10) - La justice et la protection des données à caractère...
 
PRIVACY 2.0
PRIVACY 2.0PRIVACY 2.0
PRIVACY 2.0
 
Les mégadonnées dans la recherche
Les mégadonnées dans la rechercheLes mégadonnées dans la recherche
Les mégadonnées dans la recherche
 
Cybersécurité & protection des données personnelles
Cybersécurité & protection des données personnellesCybersécurité & protection des données personnelles
Cybersécurité & protection des données personnelles
 
De la protection des données personnelles à la sécurisation des données conne...
De la protection des données personnelles à la sécurisation des données conne...De la protection des données personnelles à la sécurisation des données conne...
De la protection des données personnelles à la sécurisation des données conne...
 
Fiche pratique CCI France Règlement Général sur la Protection des Données RGPD
Fiche pratique CCI France Règlement Général sur la Protection des Données RGPDFiche pratique CCI France Règlement Général sur la Protection des Données RGPD
Fiche pratique CCI France Règlement Général sur la Protection des Données RGPD
 
Ophélie popille ouverture des données publiques à nantes
Ophélie popille   ouverture des données publiques à nantesOphélie popille   ouverture des données publiques à nantes
Ophélie popille ouverture des données publiques à nantes
 
2016-10-13 JNI - "Le cadre juridique de la santé numérique"
2016-10-13 JNI - "Le cadre juridique de la santé numérique"2016-10-13 JNI - "Le cadre juridique de la santé numérique"
2016-10-13 JNI - "Le cadre juridique de la santé numérique"
 
Sensibilisation Open Data
Sensibilisation Open DataSensibilisation Open Data
Sensibilisation Open Data
 
Sensibilisation open-data 2017
Sensibilisation open-data 2017Sensibilisation open-data 2017
Sensibilisation open-data 2017
 
GDPR Pseudonymization (French paper)
GDPR Pseudonymization (French paper)GDPR Pseudonymization (French paper)
GDPR Pseudonymization (French paper)
 
Miettes de données - Keynote BDA 2015
Miettes de données - Keynote BDA 2015Miettes de données - Keynote BDA 2015
Miettes de données - Keynote BDA 2015
 
Données personnelles et vie privée : ce qui va changer avec le RGPD
Données personnelles et vie privée : ce qui va changer avec le RGPDDonnées personnelles et vie privée : ce qui va changer avec le RGPD
Données personnelles et vie privée : ce qui va changer avec le RGPD
 

Mehr von Ministère de l'Économie et des Finances

Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...
Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...
Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...Ministère de l'Économie et des Finances
 
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...Ministère de l'Économie et des Finances
 

Mehr von Ministère de l'Économie et des Finances (20)

Au-delà du PIB, un tableau de bord pour la France - France Stratégie
Au-delà du PIB, un tableau de bord pour la France - France StratégieAu-delà du PIB, un tableau de bord pour la France - France Stratégie
Au-delà du PIB, un tableau de bord pour la France - France Stratégie
 
Public intangible assets : Issues of attractiveness
Public intangible assets : Issues of attractivenessPublic intangible assets : Issues of attractiveness
Public intangible assets : Issues of attractiveness
 
Le gouvernement soutient les communes rurales
Le gouvernement soutient les communes ruralesLe gouvernement soutient les communes rurales
Le gouvernement soutient les communes rurales
 
focus sur les mesures prises par le gouvernement pour les ruralités
focus sur les mesures prises par le gouvernement pour les ruralitésfocus sur les mesures prises par le gouvernement pour les ruralités
focus sur les mesures prises par le gouvernement pour les ruralités
 
Le Gouvernement (re)valorise les fonctionnaires
Le Gouvernement (re)valorise les fonctionnairesLe Gouvernement (re)valorise les fonctionnaires
Le Gouvernement (re)valorise les fonctionnaires
 
Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...
Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...
Présentation de Jérôme Accardo, INSEE, sur les inégalités, la pauvreté et la ...
 
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...
Présentation de Michael Forster, OCDE, sur la pauvreté, les inégalités et la ...
 
Elections departementales : Que fait le département ?
Elections departementales : Que fait le département ?Elections departementales : Que fait le département ?
Elections departementales : Que fait le département ?
 
Désintox redevance mouillage
Désintox redevance mouillageDésintox redevance mouillage
Désintox redevance mouillage
 
Projet de loi NOTRe
Projet de loi NOTReProjet de loi NOTRe
Projet de loi NOTRe
 
Projet de-loi-nouvelle-organisation-territoriale-république
Projet de-loi-nouvelle-organisation-territoriale-républiqueProjet de-loi-nouvelle-organisation-territoriale-république
Projet de-loi-nouvelle-organisation-territoriale-république
 
Un train de réformes
Un train de réformesUn train de réformes
Un train de réformes
 
La réforme territoriale en 4 C
La réforme territoriale en 4 CLa réforme territoriale en 4 C
La réforme territoriale en 4 C
 
Le projet de loi #NOTRe, c'est...
Le projet de loi #NOTRe, c'est...Le projet de loi #NOTRe, c'est...
Le projet de loi #NOTRe, c'est...
 
Infographie le "fait maison" dans la restauration
Infographie le "fait maison" dans la restaurationInfographie le "fait maison" dans la restauration
Infographie le "fait maison" dans la restauration
 
Mesurer la qualité de vie (Insee)
Mesurer la qualité de vie (Insee)Mesurer la qualité de vie (Insee)
Mesurer la qualité de vie (Insee)
 
L'ESS en Rhône-Alpes (INSEE)
L'ESS en Rhône-Alpes (INSEE)L'ESS en Rhône-Alpes (INSEE)
L'ESS en Rhône-Alpes (INSEE)
 
Livre blanc BercyCamp 2013 sur les RSP
Livre blanc BercyCamp 2013 sur les RSPLivre blanc BercyCamp 2013 sur les RSP
Livre blanc BercyCamp 2013 sur les RSP
 
Calendrier campagne ir 2012
Calendrier campagne ir 2012Calendrier campagne ir 2012
Calendrier campagne ir 2012
 
Dossier dinformation dgfip
Dossier dinformation dgfipDossier dinformation dgfip
Dossier dinformation dgfip
 

CASD -données statistique publique française insee mai 2011 (http://www.insee.fr/fr/ffc/docs_ffc/cs130e.pdf)

  • 1. Le centre d’accès sécurisé aux données de la statistique publique française : un nouvel outil pour les chercheurs !Jean-Pierre Le Gléau * et Jean-François Royer ** En 2010, l’Insee a mis en place un nouveau dispositif d’accès aux fichiers individuels de la statistique publique, essentiellement à destination des chercheurs : le CASD, « centre d’ac- cès sécurisé distant ». Rendu possible par l’évolution récente de la loi de 1951 sur le secret en matière de statistiques, il permet d’accéder à des données individuelles selon une procédure très réglementée. Cet article en donne une présentation générale. L a protection de la confiden- pression pour que ces désagrégations c’est-à-dire en pratique des données tialité des données recueillies soient de plus en plus fines est allée sur des entreprises ou des établisse- à des fins d’établissement de en croissant au fil des années, au fur et ments - la loi de 1951 a dès l’origine statistiques est un des principes ma- à mesure du progrès des techniques et prévu la possibilité de dérogations jeurs de la statistique publique. Dès des outils d’analyse statistique dans au secret statistique. Depuis 1984, 1951, la loi organisant la statistique de nombreux secteurs de la société. de telles dérogations sont possibles publique en France 1 comprenait le Or, au-delà d’un certain niveau de sous réserve d’un passage devant un mot « secret » dans son titre. Dans le détail dans les croisements, le secret comité spécialisé rattaché au code de bonnes pratiques de la statis- statistique ne peut plus être respecté, Conseil national de l’information tique européenne publié en 2005, le car les « cases de tableaux » révèlent statistique (Cnis), le comité du secret secret statistique figure au principe en fait des informations individuelles. statistique. Celui-ci examine le n° 52. Il convient en effet de pouvoir Cette contradiction est devenue parti- bien-fondé de la demande, évalue la assurer aux personnes répondant à culièrement apparente dans les nécessité d’avoir recours à des infor- une enquête que leurs réponses ne travaux des chercheurs. La commu- mations individuelles, juge le pourront en aucun cas être utilisées nauté des chercheurs en sciences sérieux du demandeur et la capacité de façon à leur porter préjudice. humaines et sociales a depuis long- de l’organisme auquel il appartient C’est pourquoi la préservation du se- temps fait valoir son besoin d’accéder et qui soutient sa demande à respec- cret statistique constitue une disposi- à des informations individuelles pour ter en pratique les contraintes liées tion majeure de la loi fondamentale effectuer des travaux de plus en plus au respect du secret statistique. En de la statistique française. complexes. Ces travaux ne nécessi- cas d’avis positif, le demandeur peut Pendant longtemps cette exigence tent pas, en général, de connaître avoir accès aux données, après n’a pas été ressentie comme une forte nommément la personne ayant signature individuelle par chaque gêne par les utilisateurs de la statis- répondu à l’enquête. Mais les cher- bénéficiaire d’un engagement à tique publique. Ceux-ci se conten- cheurs ne peuvent plus se contenter respecter les règles du secret statis- taient de résultats globaux des de disposer de résultats agrégés. Le tique. Il faut souligner que cette enquêtes ou de résultats désagrégés développement de la théorie et des possibilité, qui en pratique bénéficie selon des catégories prédéfinies (acti- outils économétriques, conjugué à à des équipes de recherche et à des vités, professions, lieux) sans que la celui de la puissance des instruments administrations publiques, ne leur est diffusion de ces résultats porte de calcul ouvre de multiples possibi- pas réservée par la loi. atteinte au secret. Cependant, la lités fondées sur l’analyse de données individuelles, que les chercheurs sont Dans le cas des « données relatives impatients d’explorer. aux faits et comportements d’ordre * Chef du département de la coordination statistique à l’Insee privé» - c’est-à-dire en pratique des ** Chercheur au Crest-Insee Accès à des données données sur des personnes ou des 1. Loi n° 51-711 du 7 juin 1951 sur l’obligation, la co- ordination et le secret en matière de statistiques individuelles : la situation ménages - la loi de 1951 ne prévoyait 2. « Le respect de la vie privée ou du secret des affaires entre 1951 et 2008 à l’origine aucune dérogation et, des fournisseurs de données (ménages, entreprises, ad- jusqu’en 2008, aucune communica- ministrations et autres répondants), la confidentialité des Dans le cas de renseignements indivi- tion de renseignements individuels informations qu’ils communiquent et l’utilisation de cel- les-ci à des fins strictement statistiques doivent être ab- duels relatifs à des « données à carac- n’était possible. Seule la communica- solument garantis ». tère économique et financier » - tion de fichiers anonymisés était licite. Courrier des statistiques n° 130, mai 2011 1
  • 2. Le centre d'accès sécurisé aux données de la statistique publique française Pour répondre à la demande de plus secret statistique, dont la compétence Le recours à un centre en plus pressante des chercheurs, a donc été étendue. d’accès sécurisé l’Insee a créé en 2006 les « fichiers de production et de recherche » (FPR), La procédure suppose, après l’avis du Depuis 2008, la loi rend donc fichiers individuels, présentant une comité du secret statistique, l’accord possible la c ommunication d e observation par individu enquêté, du service dont émanent les docu- données statistiques sur les personnes mais où l’on a au préalable supprimé ments avant la décision formelle de ou les ménages à des chercheurs. toutes les variables permettant l’identi- communication par la direction des Mais l’impératif de protection des fication directe ou indirecte des archives. Pour ce qui le concerne, répondants continue à s’imposer à personnes : nom, adresse, profession l’Insee a informé le comité du secret tous, et particulièrement aux institu- et nationalité détaillées, identification statistique, lors de sa séance du tions statistiques. C’est pourquoi de l’employeur pour les salariés, etc. 6 octobre 2009, des conditions qu’il l’Insee a choisi de recourir à un Ces FPR sont mis à la disposition des mettrait pour donner cet accord : « centre d’accès sécurisé » pour chercheurs via le réseau Quetelet, mettre en œuvre les nouvelles dispo- avec lequel l’Insee a signé une - pour les services statistiques minis- sitions permises par la loi. convention précisant les modalités de tériels (SSM), qui ont dans leur mise en œuvre du dispositif. Cette mission de gérer des dossiers couverts Qu’est-ce qu’un centre d’accès sécu- disposition a permis de satisfaire un par le secret statistique, les fichiers risé ? C’est un dispositif technique grand nombre de demandes des cher- seront transmis sous réserve de la permettant à des utilisateurs autorisés cheurs pour l’accès à des données production par eux d’un document de travailler sur des données confi- individuelles, et elle reste d’une attestant qu’ils se sont bien dotés des dentielles tout en s’assurant que ces grande utilité. moyens pour faire respecter le secret données ne risquent pas d’être statistique et que leur équipement détournées pour d’autres fins, acci- Cependant, il existe un ensemble de informatique présente bien l’étan- dentellement ou intentionnellement. demandes, légitimes du point de vue chéité suffisante par rapport à celui En matière de données statistiques, la scientifique, qui ne peuvent trouver du reste du ministère ; création des premiers centres d’accès leur satisfaction dans la mise à dispo- sécurisés destinés à la recherche - pour les autres demandeurs, l’accès sition des FPR. Ce sont les projets de remonte aux années 1990 aux USA et aux données se fera par le biais d’un recherche qui nécessitent un détail au Canada. En Europe, des pays du centre d’accès sécurisé ; géographique, par nationalité ou par Nord (Danemark, Pays-Bas) ont créé profession non disponible dans les - dans ces deux cas, les fichiers auront de tels centres au début des années FPR3, ou qui font appel à un apparie- été, si nécessaire, transformés pour 2000. Ils ont été rejoints par la ment avec d’autres fichiers, par perdre leur caractère directement Grande-Bretagne, puis l’Allemagne, 6 exemple en couplant, grâce à l’identi- nominatif ; c’est-à-dire qu’on y aura au milieu de cette décennie . fiant de l’employeur, des caractéristi- retiré, le cas échéant, le nom du ques de l’enquêté et de l’entreprise répondant et le NIR (numéro d’ins- Les premiers centres d’accès sécuri- dans laquelle il travaille. L’accès à ces cription au répertoire - le numéro de sés à des données statistiques ont été informations rompt nécessairement la Sécurité sociale) ; des centres « physiques », l’anonymat et était, de ce fait, impos- c’est-à-dire des locaux gérés par - pour les demandes d’accès à des sible jusqu’en 2008. une institution statistique (éventuel- documents directement nominatifs, lement à l’intérieur d’une universi- l’accord ne pourrait être donné que té, comme au Canada) et contenant dans le cas de la constitution d’un Les évolutions issues de un serveur de données. Dans ces échantillon pour une enquête de la la loi de 2008 concernant locaux, l’institution statistique statistique publique ayant obtenu un les données sur les ménages donne au demandeur un accès visa5 sous réserve de l’accord expli- physique directement sur le serveur. cite, au cas par cas, du comité de En 2008, la modification de la loi Cela implique que le demandeur se direction de l’Insee. statistique de 1951 par un article de la déplace pour travailler en dehors de 4 loi sur les archives a ouvert la possi- son environnement habituel. Cette bilité d’accéder à des renseignements solution exige aussi l’aménagement 3. Afin de rendre les FPR totalement anonymes, certai- indiv idue ls re la tifs a u x fa its e t nes variables géographiques, sur la nationalité ou la de locaux spécifiques (éventuelle- comportements d’ordre privé sous profession sont supprimées (code commune) ou re- ment en plusieurs points du terri- groupées en un petit nombre de modalités. deux conditions : 4. Loi n°2008-696 du 15 juillet 2008 relative aux ar- toire) matériellement sécurisés chives, article 2 (portes, fenêtres) dont la surveil- - l’une liée à la finalité : cette commu- 5. Ce visa est attribué par le ministre chargé de lance est confiée à une personne nication n’est possible qu’à des fins l’économie et le ministre à la compétence duquel res- sortissent les intéressés. assermentée. C’est la solution de statistique publique ou de 6. Pour un panorama, on pourra consulter dans le retenue au Canada et en Allemagne. recherche scientifique ou historique ; Courrier des statistiques n°121-122 de décembre Elle est très coûteuse, aussi bien 2007 : « L’accès aux micro-données et la gestion de la - l’autre liée à la procédure : celle-ci confidentialité dans quelques INS européens » par pour l’Institut de statistique que exige en effet un avis du comité du Dominique Rouault. pour les chercheurs. 2 Courrier des statistiques n° 130, mai 2011
  • 3. Jean-Pierre le Gléau et Jean-François Royer Grâce aux progrès de l’informatique, d’économie et statistique, établisse- chercheur qui estime qu’il ne peut on a vu apparaître depuis 2005 des ment public qui était jusqu’à fin 2010 pas s’en contenter et qu’il a besoin « centres d’accès sécurisés distants » une direction de l’Insee). Elle consiste des fichiers complets doit à ce stade (CASD) n’imposant plus aux cher- à mettre à disposition de l’organisme bien préciser pourquoi certaines cheurs de se déplacer dans un endroit demandeur, un terminal appelé « SD variables lui manquent encore : particulier. Ce sont des systèmes Box » pour lui permettre de se c’est l’information cruciale qu’il informatiques dans lesquels les connecter et de travailler sur le devra fournir au comité du secret données restent stockées sur un serveur installé au Genes. Cette « SD statistique. Pour cette phase d’éla- serveur unique, géré par l’institution Box » permet au chercheur de voir boration, le chercheur devra impé- statistique, mais sur lequel les cher- les données sur lesquelles il travaille, rativement prendre contact avec le cheurs peuvent travailler à distance, de les intégrer dans ses calculs et d’en service producteur, de façon à bien sans risque de dissémination. Il peut tirer des tableaux, graphiques, analy- cerner sa demande et à vérifier qu’il s’agir seulement de pouvoir ses. Mais à aucun moment il ne peut a pris connaissance de tous les soumettre des travaux à distance ni les imprimer, ni les enregistrer sur fichiers auxquels il peut avoir (« remote submission »), les résultats un support quelconque : clef USB, accès, de leurs possibilités et aussi étant récupérés de façon différée ; ou CD Rom... Ainsi, les données ne quit- de leurs limites. bien il peut s’agir d’un véritable accès tent jamais le serveur du Genes. La « en ligne » (« remote access ») c o m m u n ic a tio n e n tr e c e tte Le chercheur présente ensuite sa permettant au chercheur une forte « SD Box » et le serveur est assurée demande au comité du secret statis- interactivité avec les données. Dans par une liaison sécurisée et cryptée. tique : le secrétariat du comité ce dernier cas, le chercheur distant (comite-secret@cnis.fr) peut lui fournir travaille réellement « sur le serveur » Cette solution a commencé à fonc- toutes les indications nécessaires. Le de l’institution statistique, mais le tionner début 2010, et à ce jour une comité du secret statistique se réunit logiciel de sécurisation des données trentaine de projets de recherche en une fois par trimestre et donne un avis ; l’empêche de les exporter. bénéficient. Les deux paragraphes qui il opère comme cela a été décrit précé- suivent décrivent plus en détail le demment pour les données sur les cheminement d’un projet de entreprises. S’ajoutent cependant, La solution retenue recherche qui a recours à ce dispositif. dans les critères à prendre en compte, par l’Insee ceux de la finalité du traitement qui ne peut être, pour les données sur les Phase préparatoire : connaître Pour les demandeurs autres que les ménages, que la statistique publique les données, explorer SSM, l’Insee a donc choisi la solution du ou la recherche scientifique ou histo- les moyens d’accès, faire passage par un centre d’accès sécurisé rique. La présence du chercheur à la les formalités administratives distant en « remote access », où les séance du comité est nécessaire pour données, les métadonnées et les Concrètement, un chercheur qui que ses membres puissent recevoir les programmes d’utilisation restent donc souhaite accéder à des données indi- éclaircissements et les assurances sur un serveur central unique géré par viduelles sur les ménages produites nécessaires. l’institution statistique ou sous son par l’Insee ou par un SSM doit tout contrôle. Techniquement, cette solution d’abord prendre connaissance de la En cas d’avis favorable du comité du aurait pu être mise en œuvre en instal- source statistique dont ces données secret statistique, le chercheur peut lant un logiciel gérant la confidentialité peuvent être tirées, et des différents consulter les données sur le centre (interdisant entre autres toute recopie ou produits de diffusion de cette source. d’accès sécurisé distant. Un certain impression des données examinées) sur Pour cela, ce chercheur dispose de délai est cependant nécessaire pour chaque poste de demandeur. C’est la deux ressources documentaires prin- d’une part mettre en place les solution retenue aux Pays-Bas. Elle cipales : le site Internet de l’Insee données que le chercheur est autorisé implique une adaptation de ce logiciel à (www.insee.fr) (ou celui du SSM), à traiter, d’autre part accomplir les chaque configuration des ordinateurs ; riche en informations générales sur la formalités requises par la Commis- elle doit être modifiée lorsque cette source, en données agrégées et qui sion nationale de l’informatique et configuration change. met à disposition un fichier individuel des libertés (Cnil). anonymisé d’usage public s’il a été L a solution r e te nue pa r l’Inse e possible d’en établir un ; le site Inter- Les données disponibles sur le CASD présente les mêmes fonctionnalités, net du réseau Q u e te le t sont aujourd’hui celles auxquelles mais a l’avantage de n’impliquer (www.reseau-quetelet.cnrs.fr) qui donne accès le comité du secret aucune intervention dans le système donne accès à un dessin de fichier, et statistique, dans sa formation « ména- informatique des établissements de au « FPR » s’il en existe un. ges ». Il s’agit donc d’enquêtes statis- recherche. Elle a été mise au point et tiques auprès des ménages, récentes brevetée par l’équipe « Organisation Beaucoup de recherches, on l’a dit, ou plus anciennes, y compris le du système d’information » du Genes peuvent être conduites avec ces recensement de la population. Mais il (Groupe des écoles nationales matériaux d’accès aisé et rapide. Le s’agit aussi de données Courrier des statistiques n° 130, mai 2011 3
  • 4. Le centre d'accès sécurisé aux données de la statistique publique française administratives déjà mises à la dispo- Phase active : la formation, une « boîte aux lettres » virtuelle à sition de l’Insee ou des SSM au titre de et le travail sur le CASD laquelle il a accès. Ce fichier est bis 7 l’article 7 de la loi de 1951 . À titre examiné par des personnes habilitées d’exemple, les déclarations annuel- Dans les semaines qui suivent son au secret statistique. Elles s’assurent les de données sociales (DADS) figu- autorisation à accéder à certaines que le fichier ne contient pas d’élé- rent dans cette catégorie. D’autres données confidentielles, le chercheur ments pouvant constituer une rupture données peuvent également être est invité par les gestionnaires du du secret statistique. Si tel est le cas, introduites dans l’espace réservé au CASD à participer à une séance dite elles avertissent le chercheur et lui projet du chercheur sur le CASD, si « d’enrôlement », au cours de demandent de rectifier son fichier de leur utilisation est nécessaire dans le laquelle lui sont rappelés les princi- sortie, afin qu’il soit conforme aux cadre de l’étude pour laquelle il a pes généraux du secret statistique, la règles de la confidentialité. S’il ne demandé l’accès aux informations responsabilité personnelle qui lui comporte aucun élément de nature à confidentielles. Il peut s’agir par sera confiée et les modalités pratiques dévoiler une information confiden- exemple de données apportées par le d’accès au centre. Ces dernières tielle, il est renvoyé, par simple chercheur lui-même ; elles sont alors consistent en : messagerie, au chercheur. introduites sur le CASD par un agent - l’attribution d’une « SD Box », si habilité à la gestion du centre. Aujourd’hui, cette vérification est l’organisme dont il dépend n’en est exhaustive sur tous les fichiers de pas encore pourvue ; Comme on l’a vu plus haut, avant de résultats produits dans le CASD dont se connecter, le chercheur doit égale- - l’attribution d’une carte individuelle un chercheur demande la sortie. C’est ment avoir accompli les formalités de connexion contenant un code une solution coûteuse, car elle nécessaires auprès de la Cnil : en obtenu par traitement de ses emprein- demande une grande expertise de la général une simple déclaration (pour tes digitales, relevées au cours de part des personnes habilitées. Son les fichiers ne comportant pas de cette séance. coût augmentera avec celui de la données sensibles), exceptionnelle- fréquentation du centre. Si le nombre ment, une demande d’autorisation. Le chercheur peut avoir accès aux de personnes habilitées qui se consa- De son côté, l’Insee effectue progres- fichiers qu’il a demandés, sur la « SD crent à ce contrôle était insuffisant, sivement toutes les formalités auprès Box » qui lui a été attribuée. La recon- cela pourrait de plus entraîner des de la Cnil pour déclarer cette naissance de son identité se fait grâce retards dans le feu vert donné aux nouvelle forme de diffusion de à sa carte et à la reconnaissance de chercheurs. C’est pourquoi on pour- données à caractère personnel. Il ses empreintes digitales par le lecteur rait envisager à l’avenir de n’effectuer s’agit de modifier toutes les déclara- intégré à la SD Box. Il faut noter que cette vérification que par sondage. tions (ou demandes d’autorisation) ce dispositif ne comporte aucun stoc- Dans tous les cas, la responsabilité de effectuées par l’Insee pour les sources kage des empreintes digitales ailleurs la rupture du secret statistique reste statistiques depuis la création de la que sur la carte qui reste en posses- de la responsabilité de celui qui aurait Cnil (1978). Ce processus est long et sion du chercheur. produit le fichier fautif. L’absence plusieurs mois seront encore néces- d’un contrôle exhaustif pourrait saires avant que toutes les sources Plusieurs chercheurs peuvent être mettre en avant ce point et rappeler le concernées aient été traitées. Il se inscrits sur un même projet : le dossier chercheur à sa responsabilité person- peut donc que l’accès à certains présenté au comité du secret statis- nelle, alors qu’un contrôle exhaustif fichiers soit temporairement retardé, tique mentionne en ce cas les noms peut lui donner l’illusion (fausse) qu’il le temps que ces formalités se fassent. de tous les chercheurs associés à ce est « couvert » par la vérification Pour diminuer au maximum l’impact projet. Ceux-ci ont alors accès à un effectuée par un tiers. sur les utilisateurs du CASD, l’Insee espace spécifique sur le CASD, dédié commence évidemment en priorité à leur projet. Le gestionnaire du Lorsque le chercheur a mené ses par les fichiers les plus demandés sur centre y installe les bases de données travaux jusqu’au bout, ce qui doit celui-ci. qui leur sont spécifiques, et leur ouvre intervenir avant l’expiration de son l’accès aux fichiers de l’Insee ou des habilitation, il en avertit les SSM pour lesquels l’autorisation d’ac- gestionnaires du CASD. Son accès cès leur a été donnée. Personne au CASD est alors coupé. Cepen- d’autre qu’eux n’a accès à cet espace. d a n t, so n e s p a c e d e tr a v a il e s t Ils peuvent également utiliser la large archivé pour une durée de trois ans gamme de logiciels de calcul statis- renouvelable une fois. Cette dispo- tique et d’édition mis à la disposition sition rend possibles les éventuels 7. « Sur demande du ministre chargé de l’économie, de tous les chercheurs sur le CASD. « retours vers les données », néces- après avis du Conseil national de l’information statis- tique, et sauf disposition législative contraire, les in- saires après une publication par formations (...) recueillies dans le cadre de sa Lorsque le chercheur a terminé un exemple. Au terme de cette mission, par (...) une personne morale de droit public travail sur les données, il crée un période, tous les fichiers propres au (...) sont cédées, à des fins exclusives d’établissement de statistiques, à l’Insee ou aux services statistiques fichier de résultats (tableaux, projet chercheur et présents sur le CASD ministériels. » de publication,...) qu’il glisse dans seront détruits. 4 Courrier des statistiques n° 130, mai 2011
  • 5. Jean-Pierre le Gléau et Jean-François Royer Vers une collaboration accrue Le cas des appariements individuelles sur les entreprises. entre chercheurs et statisticiens Lorsqu’un chercheur a aujourd’hui Les chercheurs ont fréquemment accès à ces données, suite à un avis L’accès à des données individuelles de besoin d’effectuer des appariements du comité du secret statistique, il sources statistiques pour mener des de données, pour enrichir les informa- obtient ces données sur un CD crypté recherches est une nécessité pour la tions recueillies lors d’une enquête, qu’il doit conserver pendant un plupart des chercheurs contempo- par des données administratives, ou temps dans des conditions de sécuri- rains. Un premier résultat des progrès issues d’une autre enquête. Cet appa- té garantissant la confidentialité des récents pour faciliter cet accès - FPR, riement se fait souvent sur un numéro données, puis détruire. On conçoit CASD - doit être une plus grande d’identification (par exemple le NIR facilement que le CASD apportera présence et visibilité des données fran- pour les personnes physiques et le des garanties plus solides de ce point çaises dans des recherches de niveau numéro Sirène pour les personnes de vue. international, qu’elles soient menées morales). Dans certains cas, le cher- par des chercheurs français ou par des cheur pourra mener lui-même cet En 2010, l’accès au CASD était gratuit. chercheurs étrangers habilités. Il faut appariement à l’intérieur du CASD. En effet certains aspects liés à la mise préciser en effet que ni la loi, ni la Dans d’autres cas, ce ne sera pas en route (disponibilité des fichiers, pratique administrative n’interdisent possible, en particulier si c’est le NIR déclaration à la Cnil,...) ont parfois la communication de ces données à qui est en jeu. Ce numéro, on l’a vu, retardé la mise en œuvre du service des chercheurs étrangers : ceux-ci est retiré, s’il existait dans le fichier pour les chercheurs, et il aurait pu peuvent parfaitement s’engager dans initial, au moment de la mise sur le paraître anormal de facturer un service le processus de demande décrit plus CASD. Si un appariement non faisable qui n’avait pas encore atteint la qualité haut. Et le système informatique dans le CASD est cependant néces- voulue. Il est clair cependant que, permet d’installer des « SD Box » en saire, et est autorisé par la Cnil, le cher- au-delà de l’investissement initial, le tout lieu. Cependant, l’autorisation ne cheur peut demander à l’Insee de fonctionnement du CASD représente pourra être donnée que si les cher- réaliser cet appariement hors du une charge pour l’institution qui en a cheurs concernés donnent toutes les CASD et de mettre le fichier issu de la gestion : gestion des demandes, garanties nécessaires, y compris sur le l’appariement (sans les numéros récupération des fichiers, parfois plan juridique, en ce qui concerne la d’identification) sur le CASD. Il s’agit anciens, documentation, mise en sanction des ruptures éventuelles du là bien évidemment d’une prestation ligne, formalités Cnil, attribution secret statistique. spécifique, qui ne peut se faire qu’a- d’une « SD Box », licences pour les vec l’accord du gestionnaire du CASD logiciels, vérification des sorties, etc. À Un deuxième résultat de ces progrès et moyennant une facturation du l’avenir, l’accès au CASD devra donc sera une intensification de la colla- service. Le fichier apparié restera sur le couvrir les frais entraînés par ces acti- boration entre statisticiens publics CASD, sans possibilité pour le cher- vités. À ce jour, ni les modalités, ni le et chercheurs autour des sources cheur de le sortir, ni d’en tirer des niveau de cette tarification n’ont statistiques. Déjà, des formations résultats qui ne respecteraient pas les encore été complètement définis. « sources » sont organisées à l’Insee règles du secret statistique. Ce travail pour les chercheurs bénéficiaires peut aussi bien être effectué sur des Le CASD a été créé à l’Insee, au sein des autorisations : elles sont l’occa- fichiers disponibles sur le centre, qu’a- du Genes, qui en était une compo- sion d’échanges fructueux. Certai- vec un ou des fichiers apportés par le sante. Depuis le 1er janvier 2011, le nes difficultés rencontrées par les chercheur, comme résultats d’une Genes est devenu un établissement c h e r c h e u r s e n c o u r s d e tr a v a il enquête qu’il a lui-même effectuée. public d’enseignement supérieur et de devront être résolues en faisant recherche, distinct de l’Insee. En ce appel aux producteurs, ce qui qui concerne le CASD, cela a entraî- devrait enrichir la documenta- L’avenir du CASD né le transfert au Genes de tâches tion...et dans certains cas permettre incombant auparavant à l’Insee : de corriger des erreurs. Au fur et à Aujourd’hui, les capacités du CASD habilitation des gestionnaires, trans- mesure que des recherches utilisant sont encore contraintes par les limites fert des fichiers, opérations de vérifica- des données individuelles se en matériel et en personnel qualifié tion en sortie, etc. Le Genes définira, termineront, on attend des cher- nécessaire à son fonctionnement. en son sein, une structure spécifique cheurs des « retours sur les sources » : Après une inévitable période de de gouvernance pour le CASD. Ces appréciations, critiques, suggestions, rodage, on pourra envisager d’élargir modifications d’ordre administratif etc. Comme beaucoup de ces sources encore les missions qui lui sont attri- n’ont pas eu de conséquences sur l’ac- sont renouvelées périodiquement, ce buées, par exemple en se reposant sur cès au CASD par les chercheurs, pour processus peut contribuer fortement à lui également pour la mise à disposi- lesquels cette évolution a été « trans- leur amélioration progressive. tion de fichiers de données parente ». n Courrier des statistiques n° 130, mai 2011 5